機械翻訳を多言語WEBサイト(ホームページ)で使ってはいけない理由

機械翻訳(自動翻訳)を多言語WEBサイト/ホームページで使うことがNGな理由

多言語WEBサイト(ホームページ)を制作する際、自社で翻訳できる人材がいればいいのですが、なかなかそのような人材を確保すること難しいのが現実ではないでしょうか?

外部に翻訳を依頼する場合も、予算的な問題から機械翻訳も検討されると思います。

しかし、この機械翻訳は、誤った形で利用すると、致命的な失敗になりかねませんのでこれらを説明したいと思います。

機械翻訳されたテキストをインデックスさせることはスパム行為

そもそも機械翻訳をインデックスさせることは、なぜスパム行為なのでしょうか?

Googleでは、サイトを作成するためのさまざまなガイドラインを公開しています。

このガイドラインに沿って制作をすることで良好な検索結果を得ることができるようになります。

品質に関するガイドラインに明記されている

自動化されたツールで翻訳されたテキストが人間によるチェックや編集を経ず公開されたもの

上記はGoogleのウェブマスター向けガイドライン(品質に関するガイドライン)の一節であるコンテンツの自動生成からの引用です。

これは上記のガイドラインの中で「使用してはいけない手法」の具体的な例として、クローキングや隠しテキストと並んで明示されているものですので、弁解の余地がない決定的なスパム行為になるとされています。

SEOの第一人者やGoogleウェブマスター公式も注意喚起

日本のSEOの第一人者でもある辻氏も以下のように機械翻訳のインデックスはガイドライン違反であると指摘しています。

 

また、Googleのウェブマスター向け公式ブログでも言及されています。

 

まずはじめに、自動翻訳したページをインデックスの対象としないようにしてください。自動翻訳は意味が通じない場合があるため、スパムとみなされる可能性があります。また、自動翻訳されたコンテンツは、しばしばユーザーにとって理解できなかったり、不自然に感じることがあります。そのようなコンテンツを多言語のウェブサイトとして作成するのは、ユーザーにとって有益ではありません。

 

Japanese Webmaster Office Hours(ウェブマスター オフィスアワー 2019 年 4 月 25 日)でも改めて見解が表明がされました。

 

自動翻訳した記事が、クオリティが最近良くなっているから、インデックスさせても良いか?

というご質問だったんですけども、あくまでも、もちろん時代の流れとかもあるのでいろいろ考えなくてはいけないかなという部分もあるんですけど、

いちおう今のところ(動画公開は2019年4月25日)、このガイドラインに該当する可能性があります。ということをお伝えしておきます。

ブラウザの翻訳機能やGoogleウェブサイト翻訳ツールはスパムにならない

WEBサイトを機械翻訳するツールには、Google ウェブサイト翻訳ツールやBing翻訳があります。これらのツールは簡単に導入ができることから、多くの多言語WEBサイト(ホームページ)で採用されています。また、Chromeのようなブラウザの中には機械翻訳の機能をもともと備えているものがあります。

これらのツールの利用はスパム行為に該当しません。

ブラウザのURLバーをご覧いただければご理解いただけるのですが、これらjavascriptでhtmlの内容を書き換えるツールやブラウザの翻訳機能では、言語を切り替えた際にURLが変化していません。

URLはユニークなインターネットの住所ですので、URLが変化しないということは、オリジナルの言語だけが、検索エンジンにインデックスされていることになります。見た目だけが多言語化されているわけです。

翻訳の表示切り替え後の言語は、インデックスの対象外となりますので、「翻訳されたテキストが人間によるチェックや編集を経ず公開されたもの」という品質に関するガイドラインには抵触しないことになるため、スパム行為には該当しないということになります。

つまり、機械翻訳されたコンテンツをインデックスをするかどうかがスパムか否かのポイントになります。

検索エンジンからのペナルティを受けるとどうなるのか?

機械翻訳のインデックスは、検索エンジンを欺くさまざまな不正行為の1つに過ぎませんので、ペナルティもその他の不正行為と同じ内容を受けることになります。

アルゴリズムによる自動ペナルティ

2018年の8月にあったMedic Update(医療アップデート)のようにアルゴリズムの変更により、問題のあるコンテンツの順位が大幅に落とされるようなペナルティがあります。

これらは手動ペナルティへの一般ユーザからのスパムレポートをベースに日々改善されているます。問題のあるコンテンツを修正すれば、自動で解除されます。また、再審査リクエストは必要ありません。

しかし、手動ペナルティのように通知がないことから、明示的に気づくことも難しいペナルティです。

手動ペナルティ

一般ユーザからのスパムレポートなどから元にGoogleの担当チームが問題を確認して、検索結果に表示(一時的に)されないようにするものです。

Google Search Consoleを利用していれば、「手動による対策」というメニューにその旨の通知がなされます。

数十日(60〜100日?)などの単位で検索結果から削除されます。未対応にすると更に期間が伸びると言われています。修正後、再審査リクエストで対応することが望ましいです。

インデックスからの完全な削除

品質に関するガイドラインには

場合によってはスパムサイトを Google の検索結果から完全に削除することがあります

と記載あるように悪質なサイトは完全に削除されることがあります。

過去には大手サイトもペナルティの対象に

大企業であっても個人サイトであってもペナルティは発動します。

機械翻訳のインデックスではなく、クローキングと呼ばれるスパム手法のかなり古い例となりますが、2006年には、世界的な高級車メーカーであるBMWのドイツ法人と事務機器メーカーRICOHのドイツ法人がペナルティの対象となり、大ニュースとなりました。

まとめ

機械翻訳のインデックスは、知らなかったでは済まされない検索エンジンへの不正行為となります。

ウェブマスター向けガイドライン(品質に関するガイドライン)は、WEBサイト制作に関わる担当者であれば、必読のガイドラインです。

それほど長い文章ではありませんので、この機会にガイドラインに目を通すことをおすすめします。

Spokeでは、予算に応じて無料の機械翻訳と人力翻訳とHTMLコーディングが同時に利用できます。もちろんスパム的な手法は一切とっていませんので安心してご利用いただけます。

また、別途、スパムにならない公式な対策方法もブログで掲載したいと思います。