Znaki spacji mogą być kodowane jako „+” tylko w jednym kontekście: pary klucz-wartość application / x-www-form-urlencoded.
RFC-1866 (specyfikacja HTML 2.0), pkt 8.2.1. akapit pierwszy mówi: „Nazwy i wartości pól formularza są znakami ucieczki: znaki spacji są zastępowane przez„ + ”, a następnie znaki specjalne są zastępowane”).
Oto przykład takiego ciągu w adresie URL, w którym RFC-1866 zezwala na kodowanie spacji jako plusów: „ http://example.com/over/there?name=foo+bar ”. Tak więc, tylko po znaku „?” Spacje można zastąpić plusami (w innych przypadkach spacje należy zakodować na% 20). Ten sposób kodowania danych formularza jest również podany w późniejszych specyfikacjach HTML, na przykład poszukaj odpowiednich akapitów na temat application / x-www-form-urlencoded w specyfikacji HTML 4.01 i tak dalej.
Ponieważ jednak trudno jest zawsze poprawnie określić kontekst, najlepszą praktyką jest, aby nigdy nie kodować spacji jako „+”. Lepiej jest kodować procentowo wszystkie znaki oprócz „niezarezerwowanych” zdefiniowanych w RFC-3986, str. 2.3. Oto przykład kodu ilustrujący, co należy zakodować. Jest podawany w języku programowania Delphi (pascal), ale bardzo łatwo jest zrozumieć, jak działa dla każdego programisty, niezależnie od posiadanego języka:
(* percent-encode all unreserved characters as defined in RFC-3986, p.2.3 *)
function UrlEncodeRfcA(const S: AnsiString): AnsiString;
const
HexCharArrA: array [0..15] of AnsiChar = '0123456789ABCDEF';
var
I: Integer;
c: AnsiChar;
begin
// percent-encoding, see RFC-3986, p. 2.1
Result := S;
for I := Length(S) downto 1 do
begin
c := S[I];
case c of
'A' .. 'Z', 'a' .. 'z', // alpha
'0' .. '9', // digit
'-', '.', '_', '~':; // rest of unreserved characters as defined in the RFC-3986, p.2.3
else
begin
Result[I] := '%';
Insert('00', Result, I + 1);
Result[I + 1] := HexCharArrA[(Byte(C) shr 4) and $F)];
Result[I + 2] := HexCharArrA[Byte(C) and $F];
end;
end;
end;
end;
function UrlEncodeRfcW(const S: UnicodeString): AnsiString;
begin
Result := UrlEncodeRfcA(Utf8Encode(S));
end;