iPhone 11 Pro、iPhone 11 Pro Max、iPhone 11 発売中! 詳細はこちらiPhone 11 Pro、iPhone 11 Pro Max、iPhone 11 発売中! 詳細はこちら

閉じる閉じる

言語解析APIの画像

ここでは言語解析APIの特徴について紹介します。

言語解析APIとは、形態素への分割や文章全体の属性分析など、日本語文字列に対する様々な解析が行えるAPIです。

形態素解析

日本語文字列を形態素と呼ばれる単語単位に分割できます。例えば“この商品はデザインが斬新だ”という文字列は、“この”, “商品”, “は”, “デザイン”, “が”, “斬新”, “だ”というように分割できます。

固有表現抽出

人名や地名、日付表現などの固有表現を抽出できます。例えば、“鈴木さんがきょうの9時30分に横浜に行きます。”という文字列からは、人名として“鈴木”、地名として“横浜”, 日付表現として“きょう”、時刻表現として“9時30分”がそれぞれ抽出できます。

ひらがな化

日本語文字列をひらがな、カタカナによる記載に変換できます。例えば、“漢字が混ざっている文章”という文字列を、“かんじが まざっている ぶんしょう”と変換できます。

キーワード抽出

タイトルと本文からなる日本語文字列から、人名や地名、組織など文書を特徴づけるキーワードを抽出できます。例えば、“NTTドコモの本社は東京港区にあります。”という文字列から、“NTTドコモ”や“東京港区”を抽出できます。

カテゴリ分析

文全体からキーワードを抽出し解析することで、それぞれの内容に応じたカテゴリと、文全体における比重がわかります。文全体のカテゴリ属性を判断することで、キーワードのカテゴライズができたり、カテゴリの割合計算により、コンテンツの様々な属性を判断できるので、類似文章を含むコンテンツのレコメンドが可能です。

センシティブ分析

一般的にセンシティブとされる言葉を判定することができます。内容が危険度の高いカテゴリにどれくらい近しいのかなどを判別可能です。Webサービスのレギュレーション判断への活用や、政治色や軍事に関するサイトを除去するなど、無関係なコンテンツのフィルタリングが可能です。

(別ウインドウが開きます)言語解析API詳細

言語解析APIに関するリファレンスなどを掲載しています。

このページのトップへ