ワードサラダ(Word Salad)

ワードサラダとは
1 統合失調症などでみられる思考障害の一。単語の一つ一つは正しいが、それぞれがつながりをもたずに発話される状態のこと。言葉のサラダ。
2 コンピューターで自動生成された、文法的には正しいが、単語の使い方がでたらめなために意味が通らない文章。スパムメールの文面に用いたり、広告を配置したブログに埋め込んでサーチエンジンの利用者を誘導したりする。文法上は正しい構造のため、コンピューターで不審な文章を自動判別するフィルタリングソフトやサーチボットなどでは除外が難しい。

>>SEOでは「文法的には正しくても意味が支離滅裂な文章」を指します。

略歴/流れ

seoにおけるワードサラダは検索エンジンの評価を上げるための施策として作られました。

Googleなどの検索エンジンは被リンク数によって検索順位を決めています。そこで検索順位を上げるために、同一人物が複数のドメインでサイトを量産しリンクをはることで被リンク数を増やす対策が行われていました。

しかし検索エンジンのアルゴリズムが進歩すると、被リンクのためだけの中身の無いサイトは弾かれるようになりました。
そこで被リンクのためだけに用意した中身の無いサイトを有益なサイトだと認識させるためにワードサラダが登場しました。システムを使って作った大量のワードサラダを被リンク用サイトに投入すると当時の検索エンジンはテキスト量の多い良質なサイトだと認識し、検索順位を上げることができました。

現在の検索エンジンはワードサラダをスパムと認識できます。
Googleの場合、ワードサラダを使ったサイトには措置を取ることがあると言っています。
[st-mybox title=”参考” webicon=”st-svg-file-text-o” color=”#757575″ bordercolor=”” bgcolor=”#fafafa” borderwidth=”0″ borderradius=”5″ titleweight=”bold” fontsize=”” myclass=”st-mybox-class” margin=”25px 0 25px 0″] 自動的に生成されたコンテンツ(「自動生成コンテンツ」)とは、プログラムによって生成されたコンテンツのことです。Google では、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。

[/st-mybox]

ワードサラダとは

自動で生成されたテキストコンテンツのことで、 文法は正しいけれど意味が通らない文章のことを指します。

もともとは精神医学で使われていたことば

ワードサラダはもともと、認知症や統合失調症などの患者が脈絡なく単語が出てくる会話をすることを指して使われることばです。

SEO対策のためだけにシステム生成されるようになった文章の状態が似ていることからワードサラダが使われるようになりました。

ワードサラダを生成する仕組み

  • 形態素解析
  • マルコフ連鎖

この2つを使って作られることが多いです。

形態素解析とは

形態素解析とは、日常使われている自然な文を最小単位である形態素に分割する技術のことです。

例えば下記のように分割します。

これはペンです

これ | は | ペン | です

マルコフ連鎖とは

マルコフ連鎖とは、未来の挙動が現在の値だけで決定され、過去の挙動と無関係であるとする確率過程のことです。
マルコフ連鎖を利用すると、データを一定の出現率で並び替えるアルゴリズムを作成することが可能です。

ワードサラダの例

ワードサラダ(Word Salad)

このように、文法は合っていますが意味がわからない文章がワードサラダです。

人間が見れば意味が分からない文章だと認識できますが、検索エンジンは文法は合っているため質の悪い文章だと認識できませんでした。
そのためワードサラダを利用して大量に生成された文章を投入すると、検索順位のアップに効果がありました。

最近では検索エンジンがワードサラダを識別できるようになり、ワードサラダを利用したコンテンツはスパムと認識されるようになりました。

関連する単語

サーチエンジン

インターネット上に公開されているウェブ情報を、キーワードなどで検索できるウェブサイトのことです。
代表的なサーチエンジンはGoogle、Yahoo!など。

大きくディレクトリー型サーチエンジンロボット型サーチエンジンの2種類に分類されます。

ディレクトリー型サーチエンジンはWebサイトをジャンルに応じてカテゴリ分類した検索サイトのことで、一定の基準を設けて人による審査を通過したサイトを掲載している場合が多いです。Yahoo!ジャパンのYahoo!カテゴリが有名です。

ロボット型サーチエンジンはクローラーと呼ばれるプログラムが世界中のWebサイトを巡回し、自動的にWebページの情報を収集しキーワード毎にデータベースに登録していきます。「全文検索」はロボット型サーチエンジンの特徴で、Googleが有名です。

参考:アイレップ「ディレクトリ型検索エンジン
参考:weblio「ロボット型検索エンジン

サーチボット

クローラーと呼ばれるロボット型サーチエンジンのデータベースを作成するためのWeb巡回プログラムのことを指します。
世界中のウェブサイトを巡回して膨大なデータを収集します。
Webサイトに張られたリンクを巡り歩いて情報を収集していくので「スパイダー」や「ロボット」などと呼ばれます。

seoにおいてクローラー対策は重要です。
そもそもクローラーに巡回してもらわないと検索エンジンのデータベースに登録されないからです。
特に最も利用されているクローラーである「Googlebot」への対策は特に重要で、WebサイトはGooglebotの特徴を踏まえてデザインすることが望ましいです。

デジタル大辞泉

『大辞泉』は小学館が発行する大型・中型国語辞典です。
書籍版は25万語、デジタル版は2018年11月の時点で約30万語を収録しています。
1年に1回の定期更新で、世に氾濫するカタカナ語やIT関連用語の大幅追加を行うなど、従来の辞典以上に新鮮なデータを提供しています。

関連リンク

サイトマップ

パンくずリスト

アルゴリズム

Google 品質評価ガイドライン