YouTubeでは日々アップロードされる著作権に問題がある動画との格闘が繰り返されています。 自動化を旨とするGoogleは日進月歩著作権に問題のある動画を検出する精度を上げているように見えます。 毎分60時間 ものアップロードのある動画[※1] を人の目で見て著作権について是非を判断するのは事実上不可能でしょう。
思えばディレクトリ型が中心でそれは人力で構成されていた検索エンジンを 自動化されたものに置き換えたのもGoogleでした。 自動化こそがGoogleのコアコンピタンスと言えるでしょう。
検索エンジンを以てIT業界に覇を唱えた当初はその急所は Page Rank(ペイジランク) にありました。 インターネット上の膨大なURL一つ一つがランキングされたのでした。 その根幹にある考え方はネットワークでした。 リンク構造を見てネットワーク上に如何なる重みを持つかがPage Rankだったのです。
これを逆手にとってネットワーク上に重きを置かれるべく リンク構造を恣意的に作り上げる所謂SEO業者が多く生まれました。 検索結果のランキングを挙げることは充分な商売になったのです。
Googleに取ってはこれは面白い筈がありません。 Googleが検索結果の上位に表示したいのはコンテンツ力に優れたURLです。 もっと言えば検索者がクリックして満足するURLです。 ネットワーク上に重きをおかれるものを上位表示するのが決して目的ではありません。 それはコンテンツ力判断のひとつの材料に過ぎなかったのでした。 此処より所謂SEO業者とGoogleとのイタチゴッコが始まるのでした。
Googleはコンテンツ力判断の基準をPage Rankから順次増やして行きました。 そのシグナルは今や200を数えます。 これを元に検索キーワードに紐づく各URLをランキング付けしますが その際自動化されたその仕組みを アルゴリズム と称します。
ネットワーク上で優位に立つための恣意的に仕組まれたリンク構造を判断し そのランキングを落とすアルゴリズムを検索エンジンに導入した際にこれは ペンギンアップデート と呼ばれました。
更には直接コンテンツ力を判断するとされる パンダアップデート も導入されました。 これは主には重複コンテンツを低くランク付けるものだとされます。 その際に重要なのが オーソリティ であり、これは日本語では権威と訳され、 即ち重複コンテンツが数ある際にはどれが最も権威あるURLであるかを判断するものでしょう。
この考え方は飽く迄コンテンツ力判断の手法を発展させた処にあるのですが、 これが孰れと著作権と結び付くのは言う迄もないでしょう。 著作権者の提供するURLが海賊版のものよりコンテンツ力を持ち、 その上位表示が検索者に満足を齎す とは実に面白い一つの帰結です。 未だ完全ではありませんがGoogle的著作権対策の一旦と言っても良いものだと考えます。
そして今般Googleは新たに検索エンジンに著作権対策を盛り込むことを公式に発表[※3] しました。 この新たなアルゴリズムはパンダアップデートとは異なり明確に著作権対策を謳うものです。 このアップデートは来週より実施すると明言されてもいます。
此処に興味深いのが200ほどもあるランキング付けの基準となるシグナルの内にも この著作権についての是非を問うものとして採用されたシグナルです。 この新シグナルはGoogleに報告される著作権に関する不正の申し立て件数なのです。 即ち機械的に収集したWeb上のデータでなく人力に頼るものです。
デジタルミレニアム著作権法は毀誉褒貶の喧しい米国の法律ですが Googleとしてこの法に対応するに際し 著作権侵害の申し立てに対して適切な対応をとることをポリシーとする[※2] と明言しています。 此処に報告される著作権上問題があるURLであると報告された件数が即ち新シグナルの基本となります。
Google側では特定のURLが著作権的問題があると判断出来ない、 と公式ブログでその正直な処を吐露しています。 その判断は実際法廷に於いてのものが最優先される以上致し方ないでしょう。 従って新シグナルは人力に頼らざるを得ないものとなります。
このWebに於ける人海戦術はしかしWebの普及に依って可能となったもので 昨今しばしば言われる 集合知 に相当するものでしょう。 Googleには最近30日間に限っても430万件もの申し立てがあったとされます。 集合知に依ってこそ一部の恣意的なノイズは軽減され大方では真っ当な方向に向くことが推察されます。 Googleは其処に難しい著作権問題の解決法を取敢えずは託したのだと思います。
しかし自動化をコアコンピタンスとするGoogleは決してこれに満足していない気がします。 検索エンジンアルゴリズムは常なるアップデートを実施して来ました。 YouTubeに於いてもその方向への改善が図られていますし 著作権法についても推測には過ぎませんがパンダアップデートはその一環であろうと思われます。 人工ニューロンから新しく生まれるAI[K1] などにも検索エンジン著作権アルゴリズムに寄与する可能性がないとは言えないでしょう。
勿論デジタルミレニアム著作権法に関する申し立て受付も Webならではのその一環には違いありませんが、 孰れ新たなシグナルが模索の末、更に著作権問題判断の基準と採用される日が来るのではないでしょうか。 それがGoogleのDNAでしょう。 何しろ 自動車の運転迄自動化を推進するGoogle[K2] なのですから。
追記(2012年8月16日)
今回の著作権対策に関する新規アルゴリズム導入は 海外SEO情報ブログの2012年8月16日の記事[※4] に依れば エマニュエルアップデート と呼ばれているそうです。
かたむき通信参照記事(K)- Google自社データセンタ利用のAI及び機械学習のための人工ニューロンで猫発見(2012年6月30日)
- Google自動運転車が公道で自動走行テストする許可取得(2012年5月9日)
- 毎分アップロードされる動画は 60 時間分、 一日の動画視聴回数は 40 億回に(YouTube日本版公式ブログ:2012年1月24日)
- デジタル ミレニアム著作権法(Google)
- An update to our search algorithms(Google Inside Search:2012年8月10日)
- Googleエマニュエル・アップデート 〜 DMCAに基づく著作権侵害が多いサイトの順位を下げるアルゴリズムをGoogleが導入(海外SEO情報ブログ:2012年8月16日)