インキュベーションラボラトリーのサイトです。
我々はWeb上に点在している膨大なデータを収集/解析することで、面白く価値のあるアプリケーションを開発しようと取り組んでいます。
その成果の一部をこの場で公開していきたいと思います。
現在公開中のもの:
- アメーバ絵文字ツール
- Ameba絵文字⇔携帯3キャリアの絵文字変換情報を可視化したツールです。
- FeliCaTter
- FeliCaをかざしてTwitterにつぶやきます。
- Keyword Tracker
- 日本の大手ブログサービスに投稿される日あたり数十万のブログ記事を解析して、その日の話題のワードや、ワードのトレンドを分析を行っているサイトです。
- splog api
- 日本国内の大手ブログサービスのブログ記事のsplog判定を行うapiを用意しています。
- 各種資料
- 内外で発表用に作成した資料や、調査レポート資料を置いています。
日付:2010/03/09
「AutoPagerize」は技術者、ITリテラシーの高い人ならほぼ100%導入している超絶便利ツールですが、Amebaのブログ検索機能「AmebaSearch」はAutoPagerize仕様に対応しておらず、XPath定義も登録されていなかったので、追加してみました。データベース:AutoPagerizeアイテム詳細:AmebaSearchWedataにデータを登録するとき、尋常じゃないくらい登録に時間がかかり、かつWedataのサービス自体が不安定になるのが非常に気になるのですが・・・・・・無事登録はできたので、もしご興味のあるかたはAutoPagerizeをインストールした上でAmeba......
日付:2010/02/26
まだまだモデルとしては整備できてなく、やりかけの部分を感覚的にお伝えした、というニュアンスが強いのですが、テキストマイニングのツールとして辞書を用いたわかち書きに結構限界を感じていて、なんとか辞書なし≒教師なしで自然文からワードチャンキングができないか、と試行錯誤しています。今月は、その途中経過報告ということで、以下のようなものを発表させていただきました。おひろめ会~教師なしワード抽出Viewmorepresentationsfrommoaikids.Twitterのデータや、古典文書群などをコーパスとして頻出パターンの抽出というアプローチでワード・フレーズの抽出を試みた、という内容です。Tw......
日付:2010/02/26
月末といえばラボの成果報告会の季節、ということで、今月も実施しました。今月は私の方からは2つのテーマを発表しました。その1つが掲題のもの。おひろめ会~Amebloの絵文字解析Viewmorepresentationsfrommoaikids.サービスのデータ解析の副産物・オフトピック的なものとしてほぼ業務外で解析していたCGM投稿データ中の絵文字解析ですが、先月はAmebaなうについてお話したので、今月はアメブロについての解析結果の一部をご報告しました。ただしあまり真剣にまとめてないので、結構いい加減な資料ではあります。。KLabさんの勉強会でも似たような絵文字解析関連のお話をさせていただいた......




