NLP技術のデモのためにツイッターアカウントを運用しています.
新聞社のツイッターアカウントのツイートなどを取得し,解析しています.
現在,日英の2アカウントを運用しています.
空間表現を認識し,その緯度経度を推定しています.
時間表現を認識し,その表現が実際に示している時間を推定しています.
分割されていないテキストを適当な単語または形態素に分割し,それぞれの読みを推定しています.
詳細はKyTeaのページをご覧ください.
かなテキストを漢字に変換しています.
かな漢字変換エンジンのSennを用いています.
アカウントにリプライを送ることで,自由なテキストを解析させることができます.
現在 ✔ がついているコマンドが実装されています.
Command | Usage | LSTA_Linfer_en | LSTA_Linfer_jp |
---|---|---|---|
SNEL | @account SNEL [target text] | ✔ | |
TNEL | @account TNEL [target text] | ✔ | |
Word Segmentation | @account KYTEA [target text] KyTeaでも可 |
✔ | |
Kana Kanji Conversion | @account SENN [target text] | ✔ |
The map data used by LSTA-Linfer-en is made with Natural Earth. Free vector and raster map data @ naturalearthdata.com.
The latitude/longitude DB used by LSTA-Linfer-en is made with GeoNames.