2010年1月27日水曜日

句読点の処理

続いて句読点の処理。
こちらは色コードの削除に比べるとシンプルで

正規表現の検索パターンに
[は|に|を|が|の|、|。]
おまけで、助詞っぽい文字も足してあります。
本当はワード検索と組み合わせた方が無駄な空白を増やさなくてすむのですが、面倒なのでパス。

置換パターンには
\0_
アンダースコアの位置に半角スペースです。
単に半角スペースが表示出来ないので、便宜的にアンダースコア付けただけです。

ここまでやると、かなりいい具合に表示出来るようになります。

正規表現って何?って方は、一つ前のエントリから読み返して下さい。

日本語Mod作者様はSteam版でないので、日本語表示出来ないとのことで、
なんだか申し訳なくなりつつ楽しませていただいております。

本当はYahooの形態素解析APIを使ったりすれば助詞だけを抜き出したりするのも可能なんですけど。
このあたりは、PHPでWebAPIを骨までしゃぶるで扱っているので、よかったらどうぞ。

なお、クエスト達成時などにアプリケーションエラーが発生する場合は、
一時的にglobals.datを消すだけで進めます。
このファイルに関しては、日本語Modの作者様も心配していたようなので、
なにかあるのかもしれませんが、自分には分かりません。

→根本的な解決策ではありませんが、globals.datの[TITLES]ブロックを英語版のオリジナルに戻せばアプリケーションエラーで落ちることはなくなることが分かりました。

0 件のコメント:

コメントを投稿