3.3 翻訳範囲判定ロジック

「2020年を見据えた翻訳アプリケーションの開発:てがき翻訳」目次

当初アプリケーション上に手書きされた文章の翻訳範囲の自動判定機能がなく、画面内に収まらず文章を折り返して書いた場合や、1行に2文書いた場合に、翻訳結果に誤りが出るケースがあった。そこで、手書きされた文字の位置座標を用いて、1文章として翻訳するか、複数文章として翻訳するかの翻訳範囲判定ロジックを実装した(図5)。

図5 翻訳範囲判定

図5 翻訳範囲判定

処理フローは次の通りとなる。

  1. 1行か複数行かの判定を行う。
  2. 1行と判定した場合、左から順に右隣の1文字と比較し、文字と文字の間隔から「1文章」か「複数文章」かの判定を行う。なお、図5(a)のHは隣り合う文字の下端と上端の距離である。また、Wは隣り合う文字列の右端と左端の距離である。
  3. 複数行と判定した場合、1行めの文と2行めの文の位置座標を比較し、「1文章」か「複数文章」かの判定を行う。なお、図5(b)のHは1行めの文字の下端と2行めの上端の距離である。また、Wは1行めの文字列の右端と2行めの文字列左端の距離である。

4.1 東京国際空港ターミナル株式会社

本記事は、テクニカル・ジャーナルVol.24 No.3(Oct.2016)に掲載されています。

このページのトップへ