EmptyPage.jp > Whining Express > 2009-02-22

Whining Express

サイトの更新情報や日々の雑感など。

バックナンバー

2009-02-22

ひらがな・カタカナを扱う Python 2.x モジュール (kana-r1345.zip)

katakana(s)
文字列 s 内のひらがなをカタカナに変換。
>>> print kana.katakana(u'あいうえお')
アイウエオ
hiragana(s)
文字列 s 内のカタカナをひらがなに変換。
>>> print kana.hiragana(u'アイウエオ')
あいうえお
hankaku(s)
文字列 s 内の全角文字を半角文字に変換。
>>> print kana.hankaku(u'パンダ')
パンダ
zenkaku(s)
文字列 s 内の半角文字を全角文字に変換。
>>> print kana.zenkaku(u'パンダ')
パンダ
upper(s)
文字列 s 内の小書きのかなを非小書きのかなに変換。
>>> print kana.upper(u'キャッツアイ')
キヤツツアイ
lower(s)
文字列 s 内のかなを小書きのかなに変換。
>>> print kana.lower(u'キヤツツアイ')
キャッッァィ
(「キャッツアイ」になると思った人、残念でした!)
voiced(s)
文字列 s 内の清音かなを濁音がなに変換。
>>> print kana.voiced(u'カンタム')
ガンダム
unvoiced(s)
文字列 s 内の濁音がなを清音かなに変換。
>>> print kana.unvoiced(u'ジャイアン')
シャイアン
semivoiced(s)
文字列 s 内の清音かなを半濁音がなに変換。
>>> print kana.semivoiced(u'あさごはん')
あさごぱん
row(c)
かな文字 c の五十音表での行を返す。
>>> print kana.row(u'つ')
た
col(c)
かな文字 c の五十音表での段を返す。
>>> print kana.col(u'つ')
う
normalize(s)
かなを辞書順にソートするために文字列 s を正規化する。sort 関数の key 引数に渡して使うことを想定しています。
>>> print kana.normalize(u'インターネット')
インタアネット
>>> print kana.normalize(u'金子みすゞ')
金子みすず

バグなどあったらご報告ください。

さて、あと何か必要そうなのある?

最新の記事
http://www.emptypage.jp/whining/
この記事
http://www.emptypage.jp/whining/2009-02-22.html