Google画像検索は未だ不完全
Googleの画像検索、そして画像認識の技術はとても高く、手に負えないだろうと多くの人が思っていますが、どうやらそれは違うようです。完成度はまだ決して高くないようです。
Search Off the Record ポッドキャストのエピソード 10 で、Gary Illyes(ゲイリー・イリェーシュ)氏が言及しました。
不完全な理由
つまり、大まかに言うと、次のようなプロセスで画像はインデックス処理されます。
コンテンツ変換(インデックスできる形式に変える)の際に、基本的には画像タグを抽出する。あわせてほかのデータからも情報を取得する。その画像がある URL を特殊な画像インデクサーに送る。画像認識・解析が実行される。最後の画像認識・解析については深く考えてはいけないようです。それは分からない領域のことみたいです。
それは完璧とは言い難く、目指すべきレベルにはまだまだ到達できていないとのこと。
リンゴとバナナくらいは区別できますが、それより複雑なものはまだまだ区別できないだろうとのことです。
つまり精度がまだ高くないとのことです。
当然のことながら画像認識には人工知能/機械学習を用いているはず。そしてGoogle の画像認識は当然のようにかなり進んでいるはずなのですが、画像検索に関してはまだまだといったところのようです。
画像認識にはテキスト必要
そんなわけで依然として、次のような情報、特にテキストでの情報が Google には欠かせません。
つまりそれは今後も変わらないということです。alt 属性、画像のキャプション、画像サイトマップ、構造化データ。これらが今後もSEOにとって重要であることは変わらない。ということです。
これに付け加えるとしたら、画像認識を手助けするために高解像度の画像を利用したほうがよいのです。小さすぎる画像はそれがバナーなどサイズが決まっているもの以外は得することはありません。htmlでサイズを小さくするのはいいのです。とにかく元画像はなるべく大きい画像を使いましょう。
今はGoogleが画像認識をしてくれているからテキストなどいらないという声をよく聞きようになりました。しかしそれは誤りだということが分かって頂けたでしょうか。今も昔も、画像検索に最も大切なのは文字情報なのです。けれどもこれはあくまで現時点の話です。
今後AIの発展で画像だけですべてを認識できる。そんな日は遠くはないと思います。