西ヨーロッパのキャラクタセットには、大部分の西ヨーロッパ言語(フランス語、スペイン語、カタロニア語、バスク語、ポルトガル語、イタリア語、アルバニア語、オランダ語、ドイツ語、デンマーク語、スウェーデン語、ノルウェー語、フィンランド語、フェロー語、アイスランド語、アイルランド語、スコットランド語、英語など)が含まれています。
ascii
(US ASCII) 照合順序:
ascii_bin
ascii_general_ci
(デフォルト)
cp850
(DOS 西ヨーロッパ言語)
照合順序:
cp850_bin
cp850_general_ci
(デフォルト)
dec8
(DEC 西ヨーロッパ言語)
照合順序:
dec8_bin
dec8_swedish_ci
(デフォルト)
hp8
(HP 西ヨーロッパ言語)
照合順序:
hp8_bin
hp8_english_ci
(デフォルト)
latin1
(cp1252 西ヨーロッパ言語)
照合順序:
latin1_bin
latin1_danish_ci
latin1_general_ci
latin1_general_cs
latin1_german1_ci
latin1_german2_ci
latin1_spanish_ci
latin1_swedish_ci
(デフォルト)
latin1
はデフォルトキャラクタセットです。MySQLのlatin1
はWindowscp1252
キャラクタセットと同じです。つまり公式ISO
8859-1
あるいはIANA (アイアナ)
latin1
と同様ですが、アイアナlatin1
は0x80
と0x9f
間のコードポイントは「定義されていません」。
これに対して、cp1252
、つまりMySQLのlatin1
はそれらポジションに対して文字を指定しています。例えば
0x80
はユーロのサインです。cp1252
の「定義されていない」エントリーでは、MySQLは0x81
をUnicode
0x0081
、0x8d
を0x008d
、0x8f
を0x008f
、0x90
を0x0090
そして0x9d
を0x009d
に変換します。
latin1_swedish_ci
照合順序は大部分のMySQLカスタマに使用されているデフォルトです。スウェーデン語/フィンランド語の照合順序ルールに基づいているとされていますが、スウェーデン人やフィンランド人の中にはこのステートメントに賛成しない人もいます。
latin1_german1_ci
とlatin1_german2_ci
照合順序はDIN-1
およびDIN-2
標準に基づいて、DINはDeutsches
Institut für Normung
(アンシーのドイツ版)を表しています。DIN-1
は「辞書の照合順序」と呼ばれ、DIN-2は「電話帳の照合順序」と呼ばれています。
latin1_german1_ci
(辞書) ルール:
Ä = A Ö = O Ü = U ß = s
latin1_german2_ci
(電話帳)
ルール:
Ä = AE Ö = OE Ü = UE ß = ss
latin1_spanish_ci
照合順序では、
‘ñ
’ (n-tilde)
は‘n
’と‘o
’とは区別されます。
macroman
(Mac 西ヨーロッパ言語)
照合順序:
macroman_bin
macroman_general_ci
(デフォルト)
swe7
(7bit Swedish) 照合順序:
swe7_bin
swe7_swedish_ci
(デフォルト)