次に、Google は検索などの既存のビジネスシェアを侵害することなく、Gemini モデルを自社製品に統合する必要があります。

今年初めの OpenAI の台頭は世界に衝撃を与え、Microsoft が ChatGPT を Bing に組み込んだことで Google はさらに脅威になりましたが、Google は AI 競争での足場を取り戻すためにどのように 1 年を費やしたのでしょうか?

メディアが掲載した記事によると、テクノロジー大手はまず内紛を鎮め、2つの主要な人工知能部門を統合し、次にAIモデルの開発を加速し、OpenAIに追いつくことを目的としてマルチモーダルモデルを立ち上げ、最終的にはAIを立ち上げたという。強力な Gemini モデルを起動するためのチップとモデル フレームワークの包括的なレイアウトを備えた強力な Gemini モデル。

現在、Google は Gemini モデルを自社製品に統合するという最も困難な一歩を踏み出しました。

以下はウォール・ストリート・ニュースが編集した原文です。

これは、Google や他の企業が破滅論者たちに明らかに勝利したかどうかを振り返る価値のある瞬間です。

先週、Google は待望の新しい人工知能モデル Gemini を発表しましたが、1 年近く前、一部の批評家は OpenAI の ChatGPT が検索における Google のリーダーシップに挑戦するかもしれないと予測していました。現在、検索分野におけるグーグルの支配的な地位は変わらず、株価もずっと上昇している。今年。

Google は今後数か月かけて、検索などの既存のビジネスシェアを侵害することなく Gemini を自社製品に統合できることを証明しなければなりません。

同社は、ChatGPTに対抗するためにGoogleが作成したチャットボットであるBardにGeminiの簡易版を適用しているが、利用は今のところ限られているようだ、2人の関係者によると、同社は将来的にはGeminiをほぼ自社の製品ライン全体に適用する計画だという。内部の議論に詳しい関係者によると、この製品には、人工知能を使用して着用者が見ているオブジェクトを識別できるメガネなどのウェアラブルデバイスも含まれる可能性があるという。その後、デバイスは、ツールの使用方法、数学の問題の解決方法、楽器の演奏方法などの提案を着用者に提供できます。

グーグルはこうした取り組みを行う一方で、規制当局との駆け引きにも注意を払う必要があり、同社は検索エンジンと広告事業をめぐって2つの独占禁止法違反の真っ只中にあるが、独占禁止法当局者らはグーグルの人工知能の取り組みに細心の注意を払っており、それを模範としていると見ている。 Google がある分野での強みをどのように利用して別の分野で勝つことができるかについての研究であり、この場合、Google は検索から得た Web サイトのデータと数十億の顧客からのデータを使用して、新しい人工知能をトレーニングしました。

人工知能の成功は、Google のクラウド コンピューティング ビジネスにとっても重要です。人工知能モデルは非常に高い計算要件を必要とし、クラウド サービスの需要を刺激しています。マイクロソフトは OpenAI と緊密なパートナーシップを形成しており、そのクラウド ビジネスはこれまでよりも急速に成長しています。グーグルとアマゾン。

ChatGPT は会話型 AI で有名ですが、その背後にあるテクノロジーは、顧客サービスやソフトウェア コーディングの自動化から、マーケティング プランの迅速な作成、ウォール街企業による膨大な量のデータの理解の支援に至るまで、ビジネス分野全体で非常に効果的であることが証明されています。 Google が直面している問題は、OpenAI と Microsoft が率先してこのテクノロジーを消費者や企業に販売し、製品の改善に使用できる貴重なデータとフィードバックを提供していることです。

マドロナ・ベンチャー・グループのパートナー、ジョン・タロウ氏は「自分たちでテストして初めて、人々がそれを使って何を作れるかを判断できる。われわれはこれを目にし始めたばかりだが、これまでに見てきたものは注目に値する」と語った。 Amazon のクラウド コンピューティング部門で人工知能製品を担当していました。

「Gemini は Google の 25 年の歴史の中で最大の取り組みの 1 つです。Google が中年期に入る中、中核となる広告事業は巨額の利益を生み出し続けています。これはまた、親会社である Alphabet が自動運転車などの新規事業に向けて行った一連の賭けの資金にもなっています」 、健康保険、バイオテクノロジーなどの分野で、10年間にわたって行われてきたこれらの賭けは報われませんでした。

その結果、グーグル経営陣に対し18万2000人分のコスト削減を求める投資家が増えており、今年の大規模な人員削減は従業員の士気を低下させている一方、グーグルは新年にさらに従業員を解雇する準備を進めているが、それが実現するかどうかは不透明だ。人員削減は広範囲にわたるか、特定のグループを対象とする。

人工知能は、人員からハードウェアまですべてをカバーするために企業が巨額の投資を必要とするもう一つのギャンブルであり、ジェミニチームに近い関係者は、グーグルは人工知能チームがOpenAIに対抗する脅威に対抗するために巨額の資金を投資する必要があると語った。 。

また、Google は、独自の人工知能チップを設計するという、特に高価な技術的アプローチを選択しました。この決定により、Google のハードウェアは、人工知能サーバー チップの主要サプライヤーである Nvidia から独立しました。OpenAI などの競合他社は、Nvidia が製造するハードウェアに依存しています。その他。

Google はまた、その結果が単に数十年前のイノベーションに基づいているという認識を払拭したいと考えています。長年にわたり、Google は、Google Brain と DeepMind という 2 つの部門を通じて、人工知能の研究に多額の投資を行ってきました。Google は、その基礎となるテクノロジーさえ発明しました。トランスフォーマーは、OpenAI によって作成された人工知能モデルの GPT シリーズの中核です。

しかし、OpenAIの台頭により、Googleも、それ以前の他の多くの既存のテクノロジー巨人と同様に、テクノロジー分野での主導的な地位を失う可能性があるという懸念が生じている。今年 2 月に検索エンジン Bing に導入されたため、Google 幹部は特に不安を感じました。

グーグルの広報担当者はこの件についてコメントしなかった。

AI部門の戦い
GoogleとAlphabetの最高経営責任者(CEO)サンダー・ピチャイ氏は長年、同僚に対し、両社の2つの人工知能研究部門を協力させることができないと不満を漏らしてきたが、Googleは2014年にDeepMindを買収した。同氏は、この取り決めにより、同社は汎用人工知能の開発という目標をより良く達成できると信じている。

一方、DeepMind の姉妹部門である Google Brain は、AI を Google 製品に適用する方法に関する研究に焦点を当てており、Google などがより複雑なモデルをトレーニングする道を開いた発明である Transformers など、機械学習の重要な進歩を育んでいます。ジェフ・ディーン氏が率いる同社は、コーディングの仕事で Google の検索エンジンを初期の数十億人のユーザーに拡大するのに貢献したベテラン エンジニアです。

両部門の溝は深く、Google Brainはカリフォルニア州マウンテンビューのGoogle本社に本拠を置いているが、ハサビス氏とそのチームはロンドンのキングスクロス駅近くのオフィスにいる。

DeepMind で働いていた関係者によると、会社の規模が大きくなるにつれ、DeepMind は Google Brain との提携を避けるための努力を惜しまなかった、例えば、Google Brain はパリやパリなど、当時大きなビジネスがなかった都市にオフィスを開設したという。アルバータ州エドモントン. DeepMind 研究者は Google Brain によって書かれたコードにアクセスできますが、その逆はできません. Google 従業員の間でさえ、これは DeepMind の過剰な秘密主義の表れだと考える従業員もいます. ハサビス氏が DeepMind の独立性を維持するための措置を講じようとしたとき、彼は共同創設者のサーゲイ・ブリンとともに買収を主導し、アルファベットの支配権を所有していた共同創設者のラリー・ペイジと直接コミュニケーションを取ることになった。

この件に詳しい関係者によると、ハサビ氏は、軍への売却を含め、この巨大企業がテクノロジーをどのように利用するかについて懸念を強めているため、時間の経過とともにディープマインドをグーグルからより完全に分離したいと考えているとのこと。しかし2021年、ハサビス氏はディープマインドの従業員に対し、ピチャイ氏がAI倫理などの目的で同社にさらなる資金提供を約束したことで、グーグルからの離脱の取り組みは終わったと語った。

長年にわたり、リソースを巡る競争により両社間の緊張は高まっているが、グーグルは限られた数のサーバーチップを自社の人工知能研究者に配布しているが、業界の人工知能熱がチップの需要を高めるにつれ、これらのチップは品薄になってきている。

一方、Google幹部が社内政治の泥沼にはまっていることに伴い、同社の著名な人工知能研究者らが次々と退職し始めており、彼らの中には自分の会社を設立した者もおり、すでにChatGPTの妨げとなっていたGoogleの官僚的文化に不満を抱いている。 OpenAI が ChatGPT のようなサービスを開始する前に立ち上げられた企業もあれば、Google に人工知能の将来があるのではないかという懸念もあって、2015 年にマスク氏やその他の有名人によって設立された非営利スタートアップ OpenAI に買収された企業もあります。 Google Brain の主要エンジニアである Ilya Sutskever 氏は、推論によってこれまで遭遇したことのない問題を解決できる人工知能の作成など、後に多くの進歩を主導しました。

昨年 11 月に OpenAI が ChatGPT をリリースしたとき、世間の反応は Google 全体に衝撃を与えました。従業員 400 人のこのスタートアップは実際に Google を破って、さまざまなトピックに関する質問に説得力を持って回答できるチャットボットを立ち上げました。これにより、Google の競争力が疑問視されました。

関係者によると、ChatGPTの立ち上げから数週間後のスタッフ会議で、グーグルが答えなかったチャットボットに関する質問にディーン氏が答えたという。他のスタートアップの実践に。

しかし、マイクロソフトは2月までに、同社のBing検索エンジンにChatGPTを適用すると発表しており、一部の投資家はチャットボットが検索におけるグーグルの優位性を弱める可能性があり、グーグル幹部が危険にさらされる可能性があると考えている。

アイデアの融合
Google はいくつかのことを行う必要がありますが、それは高速である必要があります。

その結果、Google はわずか数か月で Bard チャットボットを作成し、今年 3 月に正式にリリースしました。Google 社内では、著名な Google 研究者であるジェイコブ デブリン氏がピチャイ氏やその他の幹部に懸念を表明したため、この作業は大騒ぎになりました。 Google が ChatGPT データを使用して人工知能モデルをトレーニングしたことが原因で辞任し、すぐに OpenAI に入社しましたが、わずか数か月後に理由は不明ですが Google に戻りました。

Google のもう 1 つの対応は、DeepMind と Google Brain の間の内紛に最終的に終止符を打つことでした。Google は、新しいモデルを作成するためにこれら 2 つのチームから研究者を選出しました。Gemini モデルは、Dean と DeepMind の上級研究員 Oriol Vinyals によって率いられました。Oriol Vinyals は、Dean とともに脳の研究を行っていました。 。

今年の 4 月、Google は Google Brain と DeepMind の合併を発表しました。ハサビス氏が新しい組織である Google DeepMind を引き継ぎ、ディーン氏は退いて Google の主任研究員になりました。この動きは、ディーン氏を信じていた多くの Google エンジニアにとって衝撃でした。彼の業績と会社での長年の勤務を考えると、彼は部門のリーダーになるべきだった。

Google Brainの研究担当副社長であるZoubin Ghahramani氏はDeepMindのロンドンオフィスを訪れ、変更が発表された週に開かれた全体会議で従業員にリストラの理由を説明した。 Google Brain は自社の従業員向けに別の会議を開催し、ハサビス氏は従業員に対し、Google DeepMind には世界最高の 2 つの人工知能研究チームが集結すると語った。

しかし、Google の人工知能従業員はすぐに、自分たちの優先順位も変化していることに気づきました。Google DeepMind のリーダーシップは、競争力のある人工知能製品の構築に重要ではない研究プロジェクトを削減しました。関係者らによると、リソースを失ったプロジェクトには GATO と呼ばれるマルチモーダル モデルが含まれており、 GenRL と呼ばれる研究チームは、Atari ゲームのような仮想環境内を移動できる人工知能システムを構築しました。

幹部らは、これらの変更には重複作業の削減と優先度の低いプロジェクトの削減という追加の利点があり、研究用チップを求めて従業員が争う必要がなくなると述べている。

マウンテンビューでは、研究者間の連携を強化するため、カンパニーパーク内の複数の建物に点在していた人工知能の従業員がパークの中央にあるオフィスに移動した。

OpenAIの爆発的な台頭の影響が徐々に薄れる中、Googleはついに反撃の機会を迎えた。

"秘密兵器"
それにもかかわらず、Google は依然として、OpenAI の最も先進的なモデルである GPT-4 を超えるモデルを構築するという大きな課題に直面しています。

「当初から、これは研究者が締め切りまでにモデル開発を完了しなければならないことを意味しました。限られた時間枠内でタスクを完了するために、従業員は昼夜を問わず働きます。このトップダウンの働き方は、Google のこれまでのやり方とはまったく異なります」関係者によると、一部の従業員は週80時間働くのが常態化しているという。

同社の人工知能以外でも、Google の従業員はこのテクノロジーを迅速に習得することが求められており、この件に詳しい 2 人の関係者によると、今年、Google Cloud は従業員に人工知能に関するテストに合格することを要求し、その他の分野の従業員に追加の資料を提供しました。 -営業などの技術職に就くことで、従業員の人工知能に関する知識レベルの向上を促進します。

Googleの目標は、Geminiがテキスト、画像、ビデオ、オーディオなどのさまざまなメディアを理解できるようにすることで、OpenAIよりも優位に立つことだ 例えば、人工知能は複雑なグラフの内容を平易な英語で説明し説明することができるとピチャイ氏は後に語った。 Gemini はこれらのタイプのデータに基づいてゼロからトレーニングすることになりますが、Pichay は、今年 3 月に OpenAI が GPT-4 が同様の画像認識機能を提供すると発表しましたが、当初これらの機能は広く利用可能ではなかったということをよく知っています。これが Google に機会を与えました」 OpenAI がリリースされる前に、Gemini を通じて幅広いマルチモーダル モデルをリリースするためです。

Google には秘密兵器もあります: YouTube. 2 人の内部関係者によると、Google の研究者は Google が所有するストリーミング サービスに大きく依存しており、画像、ビデオ、音声キャプションを含むこのデータは人工知能モデルのトレーニングに非常に貴重です。

これにより、Google は OpenAI や AI 画像スタートアップの Midjourney などのライバルよりもはるかに豊富な情報ベースを手に入れることができ、これらの関係者によると、これは Google が YouTube ユーザーが動画を削除した場合に、 Googleはまた、そのモデルが使用するデータセットからそのコンテンツを削除する予定だ。

Google のもう 1 つの利点はコンピューティング能力です。Microsoft サーバーに依存する OpenAI とは異なり、Google は独自のデータ センターを持っています。ソフトウェアをより効率的に実行するために、Google は独自の専用人工知能チップである Tensor Processing Unit (TPU) も構築しました。 Google は、Gemini プロジェクト用に驚くべき数のチップを蓄積しました — 77,000 個の第 4 世代テンソル処理ユニット (開発コード名: Pufferfish) 第 3 四半期に、Google の未割り当て企業コスト (DeepMind への支出を含む) は 40% 近く急増して 16 億ドルになりました。

ロンドンの従業員がその日の仕事を終え、マウンテンビューの従業員がその日の仕事を始める中、ジェミニのリーダーたちはプロジェクトの作業の一部を監督する従業員との毎日のミーティングを通じて研究者の進捗状況を常に把握している。 、Vinyals、および研究担当副社長のKoray Kavukcuoglu氏。

上級管理職も現場で働いており、ディーン氏は同社のアルゴリズムが大量のデータを処理できるようにするためのソフトウェア改善の先駆者となった。共同創設者のサーゲイ・ブリン氏は社内恋愛スキャンダルで一時グーグルから距離を置いたが、ジェミニ氏と協力して働いている。マウンテンビューの研究者たちと定期的に社員食堂で昼食をとります。

今年 2 月の Bard のデモでは、チャットボットがジェームズ ウェッブ宇宙望遠鏡に関して事実誤認を犯し、OpenAI に追いつくのに苦労している Google を非常に当惑させました。 2日後、この間違いが広く知られるようになると、グーグルの株価は9%下落した。

今年5月、Googleは年次開発者会議の講演でGeminiの存在を初めて明らかにし、ウォール街はこれに感銘を受け、同社の株価は同日に4%以上上昇した。

追いつくためにエネルギーを蓄える
その後数か月間、Google は Gemini のリリースに近づき、9 月に Google は一部の開発者に対し、テストに Gemini の小型バージョンを使用するよう依頼しました。

しかし、同月、OpenAI は Vision を搭載した GPT-4 を発表し、マルチモーダル機能の点で Google を破り、その技術と新しいビジネスへの注目も高まりました。 Microsoft が Azure クラウド コンピューティング部門の収益が 29% 増加したと発表したのと同じ日、Google は 10 月に、クラウド コンピューティング部門の第 3 四半期の収益の伸びが低かったことを明らかにしました。これはジェミニチームへのプレッシャーを増大させるだけであり、彼らは大きな目標を達成することを強いられるでしょう。

そして11月頃、新製品の管理審査中に、GPT-4と競合するはずだった最新鋭のGeminiモデルが英語以外の言語で正常に動作しないという問題が発生した。

「Googleを安心させているのは、OpenAIも自らの問題に対処しているということだ。2023年半ば、OpenAIはトレーニングでうまく機能しなかったため、Arrakisと呼ばれる重要な新モデルを放棄した。11月末、OpenAI取締役会はCEOを解任した」サム アルトマンと OpenAI はほぼ崩壊しましたが、この事件の後、アルトマンは OpenAI に戻り、しばらくの間船を安定させたようです。

ついに 12 月初旬、Google は Gemini を開始しました。公表されたテスト結果では、最も強力なバージョンである Gemini Ultra が、多くの業界標準ベンチマークで GPT-4 よりも優れたパフォーマンスを示しましたが、多くの研究者はこれらの主張に疑問を抱いていました。Google 自身も認めていますこのビデオの公開は、これまでビデオを見ていなかった一部の同社従業員を動揺させたが、一連の発言は、グーグルは競争する準備ができているという強いメッセージを送った。

グーグルとアルファベットのグローバル担当社長ケント・ウォーカー氏は、ニュースメディアSemaforが主催したイベントで、Microsoftが最先端技術の開発でOpenAIに依存していることを非難し、攻撃的な姿勢を見せた幹部もいた。人工知能開発を「アウトソーシング」する。

Google が現在直面している試練は、Microsoft が OpenAI テクノロジーで行ったのと同じように、Gemini をさまざまな製品アプリケーションに適用することです。しかし、Google にはライバルにはない利点があります。カスタマイズされたものはすべて人工知能の恩恵を受けています。Gemini の 1 つのバージョンは、Pixel スマートフォンで実行するように特別に設計されています。Pixel スマートフォンは、Google の人工知能チップを使用しています。

ハイテク企業が自社のハードウェアと新しい人工知能機能の統合を競う中、Pixieデバイス用の人工知能アシスタントの発売はGoogleのハードウェア事業を後押しする可能性がある 関係者によると、Pixieは顧客の携帯電話上の情報を利用するという。 、Google マップや Gmail などの製品からのデータを含む、よりパーソナライズされた Google アシスタントに進化するため、この機能は来年にも Pixel 9 と 9 Pro で導入される予定であると関係者は述べました。

最終的に Google はこの機能を通常の電話や時計などのデバイスに導入したいと考えており、同社のすべての製品アイデアをサポートするにはさらに高度なモデルが必要になるでしょう。関係者によると、Google はすでに次の大型モデルである Gemini 2 のトレーニングを行っているとのことです。

この記事がお役に立てば幸いです。
もしそうなら、チップをおくるどうぞ
https://getalby.com/p/bitcap