多言語WebサイトをGoogleがどのように認識していくのか考えるとき、まずは、「地域」と「言語」は異なることを知る必要があります。

日本では、日本 = 日本語 ですが、英語はイギリス、アメリカでも話されますし、その他多くの国で話されている言語です。この時、「英語」というのが言語であり、「アメリカ」など国名が通常は「地域」となります。

ウィキペディア「英語を公用語としている国の一覧」を見ると、2014年現在、58の国と21の地域が英語を公用語としているとあります。

地域と言語の指定

Googleは、ページの中にある言語から、自動的に言語を判断します。

日本語と他言語の場合、似たような要素がありませんので、日本語は正確に「日本語」と認識されるのではないかと思います。同時に、一つのドメイン内に日本語サイトと英語サイトを持った場合も、英語サイトと日本語サイトという判断は、間違えようがないと考えられます。

しかし、イギリス英語とアメリカ英語でサイトを分けたり、同じ英語でも記載されている通貨単位が異なるようなWebサイトを複数持つ場合、言語を指定した方が確実にGoogleに伝えることができます。また、hreflang を書かないと、「このページとこのページは、同じ内容で言語が違うバージョンである」という構造をGoogleに伝えることができません。

rel=”alternate” hreflang による地域と言語の指定

hreflang により、言語と地域を指定できます。
(例)
de: ドイツ語のコンテンツ、地域指定なし
en-GB: 英語のコンテンツ、英国のユーザー向け
de-ES: ドイツ語のコンテンツ、スペインのユーザー向け

ccTLDは、特定の1つの国に関連づけられる

地域ターゲティングの判断材料として、ccTLDがあります。ccTLDは、どの国に向けているWebサイトかをGoogleに知らせます。

ccTLD 国別コード トップレベル ドメイン : country code top-level domain
jpは日本、deはドイツ、cnは中国など、それぞれ特定の1つの国に関連付けられれているドメイン。
gTLD ジェネリック トップレベル ドメイン : Generic top-level domains
.com、.net、.org、.museum など、特定の国に関連付けられないドメイン。地域を指定したい場合は、Serach Consoleからターゲットの地域を指定できます。

Search Consoleでターゲットの地域を指定できる

インターナショナルターゲティングレポートを使用すると、hreflangタグの監視と地域ターゲットの設定ができます。
・[言語]: サイトの hreflang タグの使用状況とエラーを監視
・[国] : 必要に応じてサイト全体のターゲットとする国をサイトに設定


以下は、日本の国コードを含むトップレベルドメイン https://www…co.jp を使用し、サブディレクトリ /en/ で英語サイトを構築している場合の、インターナショナルターゲティングレポートです。


サーチコンソール 言語

このサイトはhreflangタグを指定していませんので、[言語]タブでは何も表示されません。


サーチコンソール 国

[国]タブの画面です。国コードを含むドメインのため、既に特定の地域(この場合、日本)と関連付けられています。国コードを含むドメインを使用している場合は、特定の地域を指定することはできません。


サーチコンソール

こちらは別サイト。国コードを含まないドメイン(netなど)で サブディレクトリ /en/ で英語サイトを構築している場合です。この場合は、[国]タブで、特定の国を指定することができます。


その他、Googleが地域を判断する要素

サーバーの場所(サーバーのIPアドレス)やページに記載されている住所や電話番号、Googleマイビジネスの情報なども、ターゲットユーザーを判断する材料となっています。