文章の自動要約ツールを試してみる

 

ユーザーローカルから「ユーザーローカル自動要約ツール」がWeb上で無償公開されています。

機能はもちろん、仕組みも気になったので試してみました。

自動要約ツールを使ってみる

自分のブログで試してみました。

ブログ

あまり内容が散文的でないものが好ましいと思い、「コラム」カテゴリを選択しました。


まずは「購買心理とライブコマース」から。

自分なりの要約はこんな感じ。

人からオススメされたものは購入したくなる。たとえ名も知らぬレビューアーだろうが興味をもつ。
ライブコマースも同じ系統。紹介者の印象が大切。「配信者との繋がり」ニーズと合致すればうまくいきそう。
長期的には、広告のパーソナライズ化があるため難しいのでは?

ツールで得られた要約はこちら(5行ダイジェスト)※見出しは意味的につながるように改変してから、要約しています。

さて、今回は日本ではまだ馴染みのない「ライブコマース」について触れてみたいと思います。
海外、特に中国ではすでに盛況なサービスとなっています。
オススメされたいものを買いたい欲求を刺激するサービスではあります。
新ブランド・新製品の初期購入促進への使用が効果的ではないでしょうか。
「配信者との繋がり」ニーズと合致すれば、効果が見込めるのではないでしょうか。

おお!確かに言いたいことが、きちんと抽出されています。導入から結論まで漏らしがありません。(自分の要約より良いのでは…)

要約で「重要度低」と判断されたのは、例示ですね。

「イチナナライブ,Twitch,YouTube Liveが投げ銭をできるライブ配信として有名でしょうか。」← このあたりが重要度低と判断されていました。

ただ、上の要約には含まれている「海外、特に中国ではすでに盛況なサービスとなっています。 」も同じく重要度低でした。こちらも例示ですね。

重要度の評価と、要約は異なった選定基準となっているようです。意味的に似通った文書は、要約で重複しないように選択されている?


続いて、「「CHIP」にみる、クローズド化するネットコミュニティ」。

自分なりの要約はこんな感じ。

CHIPは個人がファンクラブを設立できるサービス。
最近 ネットコミュニティはクローズド化している。
クローズドは炎上が起きにくなどのメリットがある一方、考えが先鋭化する弊害がある。
重要なのは多様性の認識。

結構文章自体を改変しちゃっていますね・・・。

さて要約ツールはどうでしょうか。

「 CHIP 」というサービスをご存知でしょうか。
ファンクラブでは会費(~10万円)が設定できます。
キングコング西野亮廣氏のコミュニティ会員数は1万人。
特定ジャンルの掲示板⇨ SNS ⇨会員制ネットサロン⇨次は何でしょう??
わざわざ会費を払って荒らしに来るアンチは(ほとんど)いないでしょう。

うーん、ちょっと論点がずれました。自分の考えに該当する部位が「重要度低」となっていて少し凹みました(笑)。

元の文章が、文書間の繋がりが小さい箇条書きのようにも見えるので、影響している?

またCHIPを引き合いに出して、自分の主張を述べている展開も良くないのでしょう。ツールの要約はCHIPの説明が主体になっており、後半の自身の主張に及んでいません。

頭に結論を持ってくる

要約ツールの仕組み

こちらの記事によると、LexRank(元論文)を使用しているようです。

Qiitaの投稿から引用させて頂くと、

LexRankはPageRankに着想を得た要約アルゴリズムです.
PageRankはGoogle創業者のL.PageとS.Brinが考案したWebページの重要度を決定するためのアルゴリズムです.
インターネット上のリンク構造を以下のようなグラフとして捉え,ページの重要度を決定していました.

ノード:Webページ
エッジ:リンク
ノードの重要度:
    1. 多くのページからリンクされているページは重要なページ
    2. 重要なページからリンクされているページは重要なページ

LexRankもPageRankと同様に文章をグラフとして捉えます.

ノード:文
エッジ:2文間の類似度(1 | 0)
ノードの重要度:
    1. 多くの文と類似する文は重要な文
    2. 重要な文と類似する文は重要な文

ここでいう類似度は簡単にいえば2文がどれだけ共通の単語を持つか,です.

意味自体の解析は行っていないのですね。(「ユーザーローカル自動要約ツール」がどうやっているかは不明です。)

おそらく「購買心理とライブコマース」は、似たような単語の使用が多いのでしょう。

うーん、面白い!

まとめ

文章の自動要約ツールを使ってみました。

ちょうどPythonで形態素解析と意味ベクトルの勉強をしていたので、自分でもトライしてみようと思います!

・・・

ちなみに、この記事の要約はこんな感じでした。

ユーザーローカルから「ユーザーローカル自動要約ツール」がWeb 上で無償公開されています。
続いて、「「 CHIP 」にみる、クローズド化するネットコミュニティ」。
結構文章自体を改変しちゃっていますね・・・。
さて要約ツールはどうでしょうか。、ちょっと論点がずれました。
頭に結論を持ってくる!、要約ツールの仕組みは?