C #을 사용한 URL 인코딩


340

POST 요청을 VB 포럼 소프트웨어에 보내고 누군가 쿠키를 설정하지 않고 로그인하는 응용 프로그램이 있습니다.

사용자가 로그인하면 로컬 컴퓨터에 경로를 만드는 변수를 만듭니다.

c : \ tempfolder \ date \ 사용자 이름

문제는 일부 사용자 이름에 "잘못된 문자"예외가 발생한다는 것입니다. 예를 들어 내 사용자 이름 인 경우 mas|fenix예외가 발생합니다.

Path.Combine( _      
  Environment.GetFolderPath(System.Environment.SpecialFolder.CommonApplicationData), _
  DateTime.Now.ToString("ddMMyyhhmm") + "-" + form1.username)

문자열에서 제거하고 싶지 않지만 사용자 이름이있는 폴더는 서버의 FTP를 통해 생성됩니다. 그리고 이것은 두 번째 질문으로 이어집니다. 서버에 폴더를 만드는 경우 "불법 문자"를 그대로 둘 수 있습니까? 서버가 Linux 기반이기 때문에이 질문 만하고 Linux가 서버를 허용하는지 확실하지 않습니다.

편집 : URL 인코딩이 내가 원하는 것이 아닌 것 같습니다. 여기 내가하고 싶은 일이 있습니다.

old username = mas|fenix
new username = mas%xxfenix

여기서 % xx는 ASCII 값 또는 문자를 쉽게 식별 할 수있는 다른 값입니다.


파일 시스템을 안전한 폴더 이름으로 만들기 위해 이것을 통합 하십시오
missaghi

답변:


191

편집 :이 답변은 이제 오래되었습니다. 아래 Siarhei Kuchuk의 답변을 참조하십시오 더 나은 수정을 위해

UrlEncoding은 여기에서 제안하는 것을 수행합니다. C #에서는 HttpUtility위에서 언급했듯이 간단히을 사용 합니다.

또한 잘못된 문자를 정규식으로 교체 한 다음 바꿀 수 있지만 올바른 문자로 바꾸려면 어떤 형태의 상태 머신 (예 : 스위치 ... 대소 문자)이 있어야하므로 훨씬 더 복잡해집니다. 이후UrlEncode이것이 오히려 쉽습니다.

Linux와 Windows의 경우 Windows에서는 Linux에서 허용되지 않는 문자가 있지만을 사용하여 Url 문자열을 디코딩하여 폴더 이름을 반환 할 수 있으므로 걱정하지 않아도됩니다 UrlDecode. 변화.


5
이 답변은 구식입니다. 아래의 몇 가지 답변을 읽으십시오-.net45에서 이것은 올바른 해결책 일 수 있습니다. msdn.microsoft.com/en-us/library/…
blueberryfields

1
FTP의 경우 모든 Uri 호환 문자 (공백, 유니 코드 ...)를 허용하는 Uri.EscapeDataString (fileOrFolderName)을 사용하여 각 Uri 파트 (폴더 또는 파일 이름)를 구성 할 수 있습니다. 예를 들어 파일 이름에 문자를 허용하려면 다음을 사용하십시오. req = (FtpWebRequest) WebRequest.Create (new Uri (path + "/"+ Uri.EscapeDataString (filename))); HttpUtility.UrlEncode ()를 사용하면 공백을 더하기 부호 (+)로 바꿉니다. 검색 엔진에는 올바른 동작이지만 파일 / 폴더 이름에는 올바르지 않습니다.
Renaud Bancel

js 스크립트를 추가하려고 할 때 경고 메시지가 표시되면 asp.net은 URL에서 대부분의 xss를 차단 A potentially dangerous Request.Path value was detected from the client합니다.
Learning

510

.NET이 URL 인코딩을 위해 제공하는 다양한 방법을 실험 해 왔습니다. 아마도 다음 표가 유용 할 것입니다 (내가 작성한 테스트 응용 프로그램의 출력으로).

Unencoded UrlEncoded UrlEncodedUnicode UrlPathEncoded EscapedDataString EscapedUriString HtmlEncoded HtmlAttributeEncoded HexEscaped
A         A          A                 A              A                 A                A           A                    %41
B         B          B                 B              B                 B                B           B                    %42

a         a          a                 a              a                 a                a           a                    %61
b         b          b                 b              b                 b                b           b                    %62

0         0          0                 0              0                 0                0           0                    %30
1         1          1                 1              1                 1                1           1                    %31

[space]   +          +                 %20            %20               %20              [space]     [space]              %20
!         !          !                 !              !                 !                !           !                    %21
"         %22        %22               "              %22               %22              "      "               %22
#         %23        %23               #              %23               #                #           #                    %23
$         %24        %24               $              %24               $                $           $                    %24
%         %25        %25               %              %25               %25              %           %                    %25
&         %26        %26               &              %26               &                &       &                %26
'         %27        %27               '              '                 '                '       '                %27
(         (          (                 (              (                 (                (           (                    %28
)         )          )                 )              )                 )                )           )                    %29
*         *          *                 *              %2A               *                *           *                    %2A
+         %2b        %2b               +              %2B               +                +           +                    %2B
,         %2c        %2c               ,              %2C               ,                ,           ,                    %2C
-         -          -                 -              -                 -                -           -                    %2D
.         .          .                 .              .                 .                .           .                    %2E
/         %2f        %2f               /              %2F               /                /           /                    %2F
:         %3a        %3a               :              %3A               :                :           :                    %3A
;         %3b        %3b               ;              %3B               ;                ;           ;                    %3B
<         %3c        %3c               <              %3C               %3C              &lt;        &lt;                 %3C
=         %3d        %3d               =              %3D               =                =           =                    %3D
>         %3e        %3e               >              %3E               %3E              &gt;        >                    %3E
?         %3f        %3f               ?              %3F               ?                ?           ?                    %3F
@         %40        %40               @              %40               @                @           @                    %40
[         %5b        %5b               [              %5B               %5B              [           [                    %5B
\         %5c        %5c               \              %5C               %5C              \           \                    %5C
]         %5d        %5d               ]              %5D               %5D              ]           ]                    %5D
^         %5e        %5e               ^              %5E               %5E              ^           ^                    %5E
_         _          _                 _              _                 _                _           _                    %5F
`         %60        %60               `              %60               %60              `           `                    %60
{         %7b        %7b               {              %7B               %7B              {           {                    %7B
|         %7c        %7c               |              %7C               %7C              |           |                    %7C
}         %7d        %7d               }              %7D               %7D              }           }                    %7D
~         %7e        %7e               ~              ~                 ~                ~           ~                    %7E

Ā         %c4%80     %u0100            %c4%80         %C4%80            %C4%80           Ā           Ā                    [OoR]
ā         %c4%81     %u0101            %c4%81         %C4%81            %C4%81           ā           ā                    [OoR]
Ē         %c4%92     %u0112            %c4%92         %C4%92            %C4%92           Ē           Ē                    [OoR]
ē         %c4%93     %u0113            %c4%93         %C4%93            %C4%93           ē           ē                    [OoR]
Ī         %c4%aa     %u012a            %c4%aa         %C4%AA            %C4%AA           Ī           Ī                    [OoR]
ī         %c4%ab     %u012b            %c4%ab         %C4%AB            %C4%AB           ī           ī                    [OoR]
Ō         %c5%8c     %u014c            %c5%8c         %C5%8C            %C5%8C           Ō           Ō                    [OoR]
ō         %c5%8d     %u014d            %c5%8d         %C5%8D            %C5%8D           ō           ō                    [OoR]
Ū         %c5%aa     %u016a            %c5%aa         %C5%AA            %C5%AA           Ū           Ū                    [OoR]
ū         %c5%ab     %u016b            %c5%ab         %C5%AB            %C5%AB           ū           ū                    [OoR]

열은 다음과 같이 인코딩을 나타냅니다.

  • UrlEncoded : HttpUtility.UrlEncode

  • 유니 코드 : HttpUtility.UrlEncodeUnicode

  • UrlPathEncoded : HttpUtility.UrlPathEncode

  • 이스케이프 된 데이터 문자열 : Uri.EscapeDataString

  • EscapedUriString : Uri.EscapeUriString

  • 인코딩 된 : HttpUtility.HtmlEncode

  • 인코딩 된 HtmlAttribute : HttpUtility.HtmlAttributeEncode

  • HexEscaped : Uri.HexEscape

노트:

  1. HexEscape처음 255 자만 처리 할 수 ​​있습니다. 따라서 ArgumentOutOfRange라틴 A- 확장 문자 (예 : Â) 에는 예외 가 발생합니다.

  2. 이 테이블은 .NET 4.0에서 생성되었습니다 (아래 .NET 4.5의 인코딩이 약간 다르다는 Levi Botelho의 의견 참조).

편집하다:

.NET 4.5 인코딩으로 두 번째 테이블을 추가했습니다. 이 답변을 참조하십시오 : https://stackoverflow.com/a/21771206/216440

편집 2 :

사람들이이 테이블을 좋아하는 것 같아서, 테이블을 생성하는 소스 코드가 마음에 들었다. .NET 4.0 또는 4.5를 대상으로 할 수있는 간단한 C # 콘솔 응용 프로그램입니다.

using System;
using System.Collections.Generic;
using System.Text;
// Need to add a Reference to the System.Web assembly.
using System.Web;

namespace UriEncodingDEMO2
{
    class Program
    {
        static void Main(string[] args)
        {
            EncodeStrings();

            Console.WriteLine();
            Console.WriteLine("Press any key to continue...");
            Console.Read();
        }

        public static void EncodeStrings()
        {
            string stringToEncode = "ABCD" + "abcd"
            + "0123" + " !\"#$%&'()*+,-./:;<=>?@[\\]^_`{|}~" + "ĀāĒēĪīŌōŪū";

            // Need to set the console encoding to display non-ASCII characters correctly (eg the 
            //  Latin A-Extended characters such as ĀāĒē...).
            Console.OutputEncoding = Encoding.UTF8;

            // Will also need to set the console font (in the console Properties dialog) to a font 
            //  that displays the extended character set correctly.
            // The following fonts all display the extended characters correctly:
            //  Consolas
            //  DejaVu Sana Mono
            //  Lucida Console

            // Also, in the console Properties, set the Screen Buffer Size and the Window Size 
            //  Width properties to at least 140 characters, to display the full width of the 
            //  table that is generated.

            Dictionary<string, Func<string, string>> columnDetails =
                new Dictionary<string, Func<string, string>>();
            columnDetails.Add("Unencoded", (unencodedString => unencodedString));
            columnDetails.Add("UrlEncoded",
                (unencodedString => HttpUtility.UrlEncode(unencodedString)));
            columnDetails.Add("UrlEncodedUnicode",
                (unencodedString => HttpUtility.UrlEncodeUnicode(unencodedString)));
            columnDetails.Add("UrlPathEncoded",
                (unencodedString => HttpUtility.UrlPathEncode(unencodedString)));
            columnDetails.Add("EscapedDataString",
                (unencodedString => Uri.EscapeDataString(unencodedString)));
            columnDetails.Add("EscapedUriString",
                (unencodedString => Uri.EscapeUriString(unencodedString)));
            columnDetails.Add("HtmlEncoded",
                (unencodedString => HttpUtility.HtmlEncode(unencodedString)));
            columnDetails.Add("HtmlAttributeEncoded",
                (unencodedString => HttpUtility.HtmlAttributeEncode(unencodedString)));
            columnDetails.Add("HexEscaped",
                (unencodedString
                    =>
                    {
                        // Uri.HexEscape can only handle the first 255 characters so for the 
                        //  Latin A-Extended characters, such as A, it will throw an 
                        //  ArgumentOutOfRange exception.                       
                        try
                        {
                            return Uri.HexEscape(unencodedString.ToCharArray()[0]);
                        }
                        catch
                        {
                            return "[OoR]";
                        }
                    }));

            char[] charactersToEncode = stringToEncode.ToCharArray();
            string[] stringCharactersToEncode = Array.ConvertAll<char, string>(charactersToEncode,
                (character => character.ToString()));
            DisplayCharacterTable<string>(stringCharactersToEncode, columnDetails);
        }

        private static void DisplayCharacterTable<TUnencoded>(TUnencoded[] unencodedArray,
            Dictionary<string, Func<TUnencoded, string>> mappings)
        {
            foreach (string key in mappings.Keys)
            {
                Console.Write(key.Replace(" ", "[space]") + " ");
            }
            Console.WriteLine();

            foreach (TUnencoded unencodedObject in unencodedArray)
            {
                string stringCharToEncode = unencodedObject.ToString();
                foreach (string columnHeader in mappings.Keys)
                {
                    int columnWidth = columnHeader.Length + 1;
                    Func<TUnencoded, string> encoder = mappings[columnHeader];
                    string encodedString = encoder(unencodedObject);

                    // ASSUMPTION: Column header will always be wider than encoded string.
                    Console.Write(encodedString.Replace(" ", "[space]").PadRight(columnWidth));
                }
                Console.WriteLine();
            }
        }
    }
}

2
이것은 환상적인 답변입니다. Uri.EscapeDataString을 사용하고 System.Web을 포함하지 않으려는 것으로 나타났습니다. 이 테이블에 감사드립니다.
Seravy

7
이것은 더 이상 100 % 정확하지 않습니다. .NET 4와 .NET 4.5 사이에서 특정 기능이 약간 변경되었습니다. stackoverflow.com/q/20003106/1068266을 참조하십시오 .
Levi Botelho

2
@Levi : 감사합니다. .NET 4.5 테이블에 두 번째 답변을 추가했습니다. 두 번째 테이블에 연결하기 위해 원래 답변을 편집했습니다.
Simon Tewsi 2014

.NET 문서 에는 사용하지 마십시오. 브라우저 호환성을 위해서만 고안되었습니다. UrlEncode를 사용하십시오. 그러나 그 방법은 다른 많은 원하지 않는 문자를 인코딩합니다. 가장 가까운 것은입니다 Uri.EscapeUriString만, null인수를 지원하지 않습니다 .
Andrew

1
언급을 잊었습니다 UrlPathEncode. 위의 의견은입니다 . 그래서 기본적으로 교체 UrlPathEncode와 함께 Uri.EscapeUriString.
Andrew

278

유효하지 않은 사용자 이름 또는 URL의 다른 부분 만 인코딩해야합니다. URL을 URL 인코딩하면 다음과 같은 문제가 발생할 수 있습니다.

string url = HttpUtility.UrlEncode("http://www.google.com/search?q=Example");

생산량

http % 3a % 2f % 2fwww.google.com % 2fsearch % 3fq % 3d 예

이것은 분명히 잘 작동하지 않을 것입니다. 대신 다음과 같이 쿼리 문자열에서 키 / 값 쌍의 값만 인코딩해야합니다.

string url = "http://www.google.com/search?q=" + HttpUtility.UrlEncode("Example");

잘하면 그것은 도움이됩니다. 또한 teedyay가 언급했듯이 불법 파일 이름 문자를 제거하지 않으면 파일 시스템이 경로를 좋아하지 않아야합니다.


33
HttpUtility.UrlPathEncode 메서드를 사용하면 여기서 설명하는 문제를 방지 할 수 있습니다.
vipirtti

12
@ DJ Pirtu : UrlPathEncode가 경로에서 원하지 않는 변경을하지는 않지만 ?(쿼리 문자열이 이미 인코딩되어 있다고 가정하기 때문에) 이후에도 인코딩하지 않습니다 . Dan Herbert의 예에서, 그가 가장하는 Example것은 인코딩이 필요한 텍스트 인 것처럼 보이 므로 HttpUtility.UrlPathEncode("http://www.google.com/search?q=Example");작동하지 않습니다. ?q=Ex&ple(원하는 결과가있는 곳)으로 시도하십시오 ?q=Ex%26ple. (1) UrlPathEncode는 뒤에 아무 것도 접촉하지 않으며 ?(2) UrlPathEncode는 &어쨌든 인코딩하지 않기 때문에 작동하지 않습니다 .
Tim Goodman

1
connect.microsoft.com/VisualStudio/feedback/details/551839/…를 참조하십시오. 물론 &쿼리 문자열 매개 변수를 구분해야하기 때문에 UrlPathEncode가 인코딩하지 않는 것이 좋습니다 . 그러나 인코딩 된 앰퍼샌드도 원하는 경우가 있습니다.
Tim Goodman

10
HttpUtility은 최신 버전의 WebUtility에 의해 성공했습니다. 시간을 절약하십시오 :)
Wiseman

190

더 나은 방법은 사용하는 것입니다

Uri.EscapeUriString

.net의 전체 프로필을 참조하지 않기 위해 4.


1
"클라이언트 프로필"은 System.Net을 사용하지만 System.Web을 사용하지 않는 앱에는 충분하기 때문에 완전히 동의합니다. ;-)
hfrmobile

6
OP는 파일 시스템 호환성을 확인하는 것에 대해 이야기하고 있으므로 작동하지 않습니다. Windows에서 허용되지 않는 문자 집합은 '[ "/", "\\", "<", ">", ":", "\" ","| ","? ","* "]'입니다. EscapedUriString을 사용하여 인코딩되지 않습니다 (아래 표 참조-@Simon Tewsi 표 덕분에). "%"또는 "% 3f"가 원래 입력에있는 문제는 "디코드"가 원래와 다를 것입니다.
m1m1k

6
이 점은 파일 시스템을위한
WONT

1
또한 .NET Framework 4.5부터 클라이언트 프로필이 중단되었으며 재배포 가능한 전체 패키지 만 사용할 수 있습니다.
twomm

29
stackoverflow.com/a/34189188/3436164 사용 Uri.EscapeDataString하지 Uri.EscapeUriString마십시오이 의견을 읽으면 도움이됩니다.
ykadaru 2016 년

181

이후 .NET 프레임 워크 4.5.NET 표준 1.0 당신은 사용해야합니다 WebUtility.UrlEncode. 대안에 비해 장점 :

  1. .NET Framework 4.5 이상, .NET Core 1.0 이상, .NET Standard 1.0 이상, UWP 10.0 이상 및 모든 Xamarin 플랫폼의 일부입니다. HttpUtility.NET Framework 이전 버전 (.NET Framework 1.1+)에서 사용 가능하지만 다른 플랫폼 (.NET Core 2.0+, .NET Standard 2.0+)에서 훨씬 나중에 제공되며 UWP에서는 여전히 사용할 수 없습니다 ( 관련 질문 참조 ).

  2. .NET Framework에서는에 상주System.dll 하므로 HttpUtility. 와 달리 추가 참조가 필요하지 않습니다 .

  3. 그것은 제대로 URL에 대한 문자를 이스케이프 는 달리, Uri.EscapeUriString(참조 drweb86의 대답에 의견을 ).

  4. 문자열의 길이에 어떤 제한이없는 달리, Uri.EscapeDataString(참조 관련 질문을 )은 예를 들어, POST 요청을 사용할 수 있도록.


공백으로 % 20 대신 "+"를 사용하여 인코딩하는 방식이 마음에 듭니다. 그러나이 URL은 여전히 ​​"URL에서"를 제거하지 않고 잘못된 URL을 제공합니다 ... 아, 음. "" "", "")
Piotr Kula

84

Levi Botelho는 인코딩이 .NET 4.0과 4.5 사이에서 약간 변경 되었기 때문에 이전에 생성 된 인코딩 테이블이 더 이상 .NET 4.5에 대해 정확하지 않다고 언급했습니다. 따라서 .NET 4.5의 테이블을 다시 생성했습니다.

Unencoded UrlEncoded UrlEncodedUnicode UrlPathEncoded WebUtilityUrlEncoded EscapedDataString EscapedUriString HtmlEncoded HtmlAttributeEncoded WebUtilityHtmlEncoded HexEscaped
A         A          A                 A              A                    A                 A                A           A                    A                     %41
B         B          B                 B              B                    B                 B                B           B                    B                     %42

a         a          a                 a              a                    a                 a                a           a                    a                     %61
b         b          b                 b              b                    b                 b                b           b                    b                     %62

0         0          0                 0              0                    0                 0                0           0                    0                     %30
1         1          1                 1              1                    1                 1                1           1                    1                     %31

[space]   +          +                 %20            +                    %20               %20              [space]     [space]              [space]               %20
!         !          !                 !              !                    %21               !                !           !                    !                     %21
"         %22        %22               "              %22                  %22               %22              &quot;      &quot;               &quot;                %22
#         %23        %23               #              %23                  %23               #                #           #                    #                     %23
$         %24        %24               $              %24                  %24               $                $           $                    $                     %24
%         %25        %25               %              %25                  %25               %25              %           %                    %                     %25
&         %26        %26               &              %26                  %26               &                &amp;       &amp;                &amp;                 %26
'         %27        %27               '              %27                  %27               '                &#39;       &#39;                &#39;                 %27
(         (          (                 (              (                    %28               (                (           (                    (                     %28
)         )          )                 )              )                    %29               )                )           )                    )                     %29
*         *          *                 *              *                    %2A               *                *           *                    *                     %2A
+         %2b        %2b               +              %2B                  %2B               +                +           +                    +                     %2B
,         %2c        %2c               ,              %2C                  %2C               ,                ,           ,                    ,                     %2C
-         -          -                 -              -                    -                 -                -           -                    -                     %2D
.         .          .                 .              .                    .                 .                .           .                    .                     %2E
/         %2f        %2f               /              %2F                  %2F               /                /           /                    /                     %2F
:         %3a        %3a               :              %3A                  %3A               :                :           :                    :                     %3A
;         %3b        %3b               ;              %3B                  %3B               ;                ;           ;                    ;                     %3B
<         %3c        %3c               <              %3C                  %3C               %3C              &lt;        &lt;                 &lt;                  %3C
=         %3d        %3d               =              %3D                  %3D               =                =           =                    =                     %3D
>         %3e        %3e               >              %3E                  %3E               %3E              &gt;        >                    &gt;                  %3E
?         %3f        %3f               ?              %3F                  %3F               ?                ?           ?                    ?                     %3F
@         %40        %40               @              %40                  %40               @                @           @                    @                     %40
[         %5b        %5b               [              %5B                  %5B               [                [           [                    [                     %5B
\         %5c        %5c               \              %5C                  %5C               %5C              \           \                    \                     %5C
]         %5d        %5d               ]              %5D                  %5D               ]                ]           ]                    ]                     %5D
^         %5e        %5e               ^              %5E                  %5E               %5E              ^           ^                    ^                     %5E
_         _          _                 _              _                    _                 _                _           _                    _                     %5F
`         %60        %60               `              %60                  %60               %60              `           `                    `                     %60
{         %7b        %7b               {              %7B                  %7B               %7B              {           {                    {                     %7B
|         %7c        %7c               |              %7C                  %7C               %7C              |           |                    |                     %7C
}         %7d        %7d               }              %7D                  %7D               %7D              }           }                    }                     %7D
~         %7e        %7e               ~              %7E                  ~                 ~                ~           ~                    ~                     %7E

Ā         %c4%80     %u0100            %c4%80         %C4%80               %C4%80            %C4%80           Ā           Ā                    Ā                     [OoR]
ā         %c4%81     %u0101            %c4%81         %C4%81               %C4%81            %C4%81           ā           ā                    ā                     [OoR]
Ē         %c4%92     %u0112            %c4%92         %C4%92               %C4%92            %C4%92           Ē           Ē                    Ē                     [OoR]
ē         %c4%93     %u0113            %c4%93         %C4%93               %C4%93            %C4%93           ē           ē                    ē                     [OoR]
Ī         %c4%aa     %u012a            %c4%aa         %C4%AA               %C4%AA            %C4%AA           Ī           Ī                    Ī                     [OoR]
ī         %c4%ab     %u012b            %c4%ab         %C4%AB               %C4%AB            %C4%AB           ī           ī                    ī                     [OoR]
Ō         %c5%8c     %u014c            %c5%8c         %C5%8C               %C5%8C            %C5%8C           Ō           Ō                    Ō                     [OoR]
ō         %c5%8d     %u014d            %c5%8d         %C5%8D               %C5%8D            %C5%8D           ō           ō                    ō                     [OoR]
Ū         %c5%aa     %u016a            %c5%aa         %C5%AA               %C5%AA            %C5%AA           Ū           Ū                    Ū                     [OoR]
ū         %c5%ab     %u016b            %c5%ab         %C5%AB               %C5%AB            %C5%AB           ū           ū                    ū                     [OoR]

열은 다음과 같이 인코딩을 나타냅니다.

  • UrlEncoded : HttpUtility.UrlEncode
  • 유니 코드 : HttpUtility.UrlEncodeUnicode
  • UrlPathEncoded : HttpUtility.UrlPathEncode
  • WebUtilityUrlEncoded : WebUtility.UrlEncode
  • 이스케이프 된 데이터 문자열 : Uri.EscapeDataString
  • EscapedUriString : Uri.EscapeUriString
  • 인코딩 된 : HttpUtility.HtmlEncode
  • 인코딩 된 HtmlAttribute : HttpUtility.HtmlAttributeEncode
  • WebUtilityHtml 인코딩 : WebUtility.HtmlEncode
  • HexEscaped : Uri.HexEscape

노트:

  1. HexEscape는 처음 255 자만 처리 할 수 ​​있습니다. 따라서 라틴 A 확장 문자 (예 : Â)에 대해 ArgumentOutOfRange 예외가 발생합니다.

  2. 이 테이블은 .NET 4.5에서 생성되었습니다 ( .NET 4.0 이하의 인코딩에 대해서는 https://stackoverflow.com/a/11236038/216440 참조).

편집하다:

  1. Discord의 답변 결과 .NET 4.5에 도입 된 새로운 WebUtility UrlEncode 및 HtmlEncode 메서드를 추가했습니다.

2
사용자 UrlPathEncode가 아닙니다. MSDN조차도 사용하지 말라고 말합니다. netscape 2 msdn.microsoft.com/en-us/library/…
Jeff

Server.URLEncode가이 주제의 또 다른 변형입니까? 다른 출력을 생성합니까?
ALEXintlsos

2
@ALEX : ASP.NET에서 서버 개체는 HttpServerUtility의 인스턴스입니다. dotPeek 디 컴파일러를 사용하여 HttpServerUtility.UrlEncode를 살펴 보았습니다. HttpUtility.UrlEncode 만 호출하므로 두 메소드의 출력이 동일합니다.
Simon Tewsi

이처럼 많은 인코딩 방법을 사용하더라도 → 또는 ☠과 같은 Latin-1 이상의 모든 항목에 대해서는 여전히 훌륭하게 실패합니다. (UrlEncodedUnicode는 적어도 유니 코드를 지원하려고 시도하지만 더 이상 사용되지
않거나

Simon,이 답변을 수락 된 답변에 통합 할 수 있습니까? 하나의 대답으로하는 것이 좋을 것입니다. 당신은 그것을 통합하고 답의 맨 아래에 h1 제목을 만들거나 하나의 테이블에 통합하고 다음과 같이 다른 줄을 표시 할 수 있습니다. (Net4.0) ? %3f................................ (Net4.5) ? %3f ..................................
T.Todua

60

.NET에서는 URL 인코딩이 쉽습니다. 사용하다:

System.Web.HttpUtility.UrlEncode(string url)

폴더 이름을 가져 오기 위해 디코딩 된 경우에도 폴더 이름에 사용할 수없는 문자 (*,?, / 등)를 제외해야합니다.


알파벳의 일부가 아닌 모든 문자를 인코딩합니까?
masfenix

1
URL 인코딩은 URL에서 허용되지 않는 문자를 문자와 동등한 문자로 변환합니다. 안전하지 않은 문자 목록 : blooberry.com/indexdot/html/topics/urlencoding.htm
Ian Robinson

HttpUtility.UrlEncode에 MSDN 링크 : msdn.microsoft.com/en-us/library/4fkewx0t.aspx
이안 로빈슨

11
전체 System.Web ... 부분을 대답에 넣는 것이 좋습니다. 많은 시간을 절약 할 수 있습니다. :) 고맙습니다
Liam

3
URL의 모든 문자를 인코딩 할 필요는 없으며 querystring의 매개 변수 값만 위험합니다. 제안하는 방식은 쿼리 문자열에 여러 매개 변수를 만드는 데 필요한 &도 인코딩합니다. 필요한 경우 매개 변수의 각 값을 인코딩하는 것이
좋습니다

12

System.Web이 보이지 않으면 프로젝트 설정을 변경하십시오. 대상 프레임 워크는 ".NET Framework 4 Client Profile"대신 ".NET Framework 4"여야합니다.


1
제 생각에 개발자들은 ".NET Profiles"에 대해 알고 있어야 하며 그들의 목적에 맞는 것을 사용해야 합니다! 왜 전체 프로필을 추가하는지 이유를 알지 못하고 전체 프로필을 추가하는 것만으로는 충분하지 않습니다 (예 : System.Web). 클라이언트 앱에 대해 "클라이언트 프로파일"을 사용 하고 필요할 때만 전체 프로파일을 사용하십시오 (예 : WinForms 또는 WPF 클라이언트는 전체 프로파일이 아닌 클라이언트 프로파일을 사용해야합니다)! 예를 들어 클라이언트 응용 프로그램에서 HttpServerUtility를 사용하는 이유를 알 수 없습니다 ^^ ... 이것이 필요한 경우 응용 프로그램 디자인에 문제가 있습니다!
hfrmobile

4
정말? 클라이언트 앱이 URL을 구성 할 필요가 없습니까? 생계 관리를 위해 무엇을하십니까?
sproketboy

@hfrmobile : 아니요. 한 번만 살았고 다음 버전에서는 포기 된 프로필 모델에는 문제가 있습니다. 그리고 처음부터 분명했습니다. 지금 당신에게 분명합니까? 먼저 생각하십시오, msft가 당신을 팔려고하는 모든 것을 '있는 그대로'받아들이지 마십시오; P
abatishchev

죄송하지만 클라이언트가 URL을 작성 / 사용할 필요가 없다고 말한 적이 없습니다. .NET 4.0을 사용하는 한 사용자는 이에주의해야합니다. 간단히 말해 : 개발자는 클라이언트에 HttpServerUtility를 추가하기 전에 두 번 생각해야합니다. 다른 방법이나 더 나은 방법이 있습니다. 139 표의 답변이나 ".NET Framework 4.5부터 WebUtility.UrlEncode를 사용할 수 있습니다. 먼저 System.dll에 상주하므로 추가 참조가 필요하지 않습니다."
hfrmobile

9

의 .NET 구현은 UrlEncodeRFC 3986을 준수하지 않습니다.

  1. 일부 문자는 인코딩되지 않았지만 인코딩되어야합니다. !()*문자 인코딩 아직 .NET이 문자를 인코딩하는 데 실패해야 예약 문자로 RFC의 2.2 절에 나와 있습니다.

  2. 일부 문자는 인코딩되지만 인코딩되지 않아야합니다. .-_문자는 잘못 아직 .NET 코드 이러한 문자를 인코딩하지 말아야 예약 문자로 RFC의 2.2 절에 나열되지 않습니다.

  3. RFC는 일관성을 유지하기 위해 구현시 대문자 HEXDIG를 사용해야하는데, 여기서 .NET은 소문자 HEXDIG를 생성합니다.


4

나는 여기 사람들이 UrlEncode 메시지에 의해 추락했다고 생각합니다. URLEncoding이 아닙니다 원하는 . 대상 시스템에서 파일 이름으로 작동하지 않는 것을 인코딩하려고합니다.

일반성을 원한다고 가정하면 여러 시스템 (MacOS, Windows, Linux 및 Unix)에서 불법 문자를 자유롭게 찾아서 탈출하여 일련의 문자를 구성하십시오.

이스케이프에 대해서는 HexEscape가 양호해야합니다 (문자를 % XX로 대체). 유니 코드를 수행하지 않는 시스템을 지원하려면 각 문자를 UTF-8 바이트로 변환하고 128보다 큰 모든 것을 인코딩하십시오. 그러나 백 슬래시 "\"또는 HTML 인코딩 "" "과 같은 다른 방법이 있습니다. 직접 만들 수 있습니다. 모든 시스템에서 호환되지 않는 문자를 '인코딩'하기 만하면됩니다. 원래 이름-나쁜 문자를 공백으로 바꾸는 것과 같은 것이 작동합니다.

위와 동일한 접선에서 사용할 유일한 것은

Uri.EscapeDataString

-OAuth에 필요한 모든 것을 인코딩하고, OAuth가 인코딩을 금지하는 것을 인코딩하지 않으며, +20이 아닌 공백을 % 20으로 인코딩합니다 (OATH 사양에도 해당) : RFC 3986. AFAIK, 이것은 최신 URI 사양.


3

모든 기호를 URL 인코딩하는 C # 메서드를 작성했습니다.

    /// <summary>
    /// !#$345Hf} → %21%23%24%33%34%35%48%66%7D
    /// </summary>
    public static string UrlEncodeExtended( string value )
    {
        char[] chars = value.ToCharArray();
        StringBuilder encodedValue = new StringBuilder();
        foreach (char c in chars)
        {
            encodedValue.Append( "%" + ( (int)c ).ToString( "X2" ) );
        }
        return encodedValue.ToString();
    }

1

이상적으로는 "FileNaming"이라는 클래스에 들어가거나 Encode의 이름을 "FileNameEncode"로 바꿉니다. 참고 : 이들은 전체 경로를 처리하도록 설계되지 않았으며 폴더 및 / 또는 파일 이름 만 처리합니다. 이상적으로는 전체 경로를 먼저 분할 ( "/") 한 다음 조각을 확인하십시오. 분명히 노동 조합 대신 Windows에서 허용되지 않는 문자 목록에 "%"문자를 추가 할 수는 있지만이 방법이 더 유용하고 읽기 쉽고 사실이라고 생각합니다. Decode ()는 완전히 동일하지만 Replace (Uri.HexEscape (s [0]), s)를 문자로 "이스케이프"로 전환합니다.

public static List<string> urlEncodedCharacters = new List<string>
{
  "/", "\\", "<", ">", ":", "\"", "|", "?", "%" //and others, but not *
};
//Since this is a superset of urlEncodedCharacters, we won't be able to only use UrlEncode() - instead we'll use HexEncode
public static List<string> specialCharactersNotAllowedInWindows = new List<string>
{
  "/", "\\", "<", ">", ":", "\"", "|", "?", "*" //windows dissallowed character set
};

    public static string Encode(string fileName)
    {
        //CheckForFullPath(fileName); // optional: make sure it's not a path?
        List<string> charactersToChange = new List<string>(specialCharactersNotAllowedInWindows);
        charactersToChange.AddRange(urlEncodedCharacters.
            Where(x => !urlEncodedCharacters.Union(specialCharactersNotAllowedInWindows).Contains(x)));   // add any non duplicates (%)

        charactersToChange.ForEach(s => fileName = fileName.Replace(s, Uri.HexEscape(s[0])));   // "?" => "%3f"

        return fileName;
    }

위의 매우 유용한 테이블에 대해 @ simon-tewsi에게 감사드립니다!


유용한 정보 :Path.GetInvalidFileNameChars()
m1m1k

예. 이를 수행하는 한 가지 방법이 있습니다. foreach (System.IO.Path.GetInvalidFileNameChars ()의 char c) {filename = filename.Replace (c, '_'); }
02 분에 netfed

0

@ Dan Herbert의 답변 외에도 일반적으로 값을 인코딩해야합니다.

Split에는 params 매개 변수가 있습니다. Split ( '&', '='); 식은 먼저 &로 나눈 다음 '='로 나뉘므로 홀수 요소는 아래에 표시된 모든 값으로 인코딩됩니다.

public static void EncodeQueryString(ref string queryString)
{
    var array=queryString.Split('&','=');
    for (int i = 0; i < array.Length; i++) {
        string part=array[i];
        if(i%2==1)
        {               
            part=System.Web.HttpUtility.UrlEncode(array[i]);
            queryString=queryString.Replace(array[i],part);
        }
    }
}
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.