2006-01-23

del.icio.us note の文字制限

ソーシャル・ブックマークの del.icio.us。サイトの URL とタイトルとノート、それにタグをセットで残せる。ノートは自分用のメモで、入力フォーム三行分のテキストを入力できる (それを越えると、del.icio.us は容赦なくはしょってくれる)。

前々から不思議に思ってたのは、ノートに英語なら三行分書けるのに、日本語だと二行分しか書けないこと。アルファベット (ASCII 文字) は一文字一バイト。日本語は俗に二バイト文字とも呼ばれ、一文字で二バイト使う。手元の環境は等幅フォントを使っているので、アルファベット二文字がちょうど日本語一文字分の幅を持つ。だから、アルファベット二文字は二バイトで日本語一文字分のバイト数・幅になる。どうして日本語は二行分しか書けないのか?

今朝、Portable Firefox の記事を書いてて、急にフッと分かっちゃった (たぶん)。

del.icio.us はデータを utf-8 で保存してる。そして utf-8 では日本語は三バイト!! だから、日本語二行分でアルファベット三行分のバイト数を消費してたに違いない。

日本語 = 二バイト という思い込みには、気をつけないとね。

No comments:

Post a Comment