Google Research
research.google/blog/
A new quantum toolkit for optimization
Google Quantum AIの研究者たちは、量子コンピュータが従来のコンピュータでは解決できない最適化問題を解決できる可能性を示す新しい理論的研究を発表しました。彼らは、Decoded Quantum Interferometry(DQI)と呼ばれる効率的な量子アルゴリズムを紹介し、量子力学の波の性質を利用して、古典的なコンピュータでは非常に難しい近似解に収束する干渉パターンを生成します。しかし、この干渉パターンを構築するためには、デコーディングと呼ばれる別の難しい計算問題を解決する必要があります。特定の最適化問題に対して、関連するデコーディング問題が強力なアルゴリズムによって解決可能であることが発見されました。最終的に、DQIアルゴリズムを使用することで、量子コンピュータは古典的に困難な最適化問題を解決できる可能性があります。 • 量子コンピュータが従来のコンピュータでは解決できない最適化問題を解決できる可能性がある。 • Decoded Quantum Interferometry(DQI)という新しい量子アルゴリズムを提案。 • DQIは量子力学の波の性質を利用して干渉パターンを生成し、近似解に収束する。 • 干渉パターンを構築するためにはデコーディング問題を解決する必要がある。 • 特定の最適化問題に対して、デコーディング問題が強力なアルゴリズムで解決可能であることが発見された。 • DQIアルゴリズムを使用することで、量子コンピュータは古典的に困難な最適化問題を解決できる。
Differentially private machine learning at scale with JAX-Privacy
JAX-Privacy 1.0は、JAXライブラリ上で動作する差分プライバシー機械学習のためのツールキットです。AIモデルの精度はデータの質に依存しており、個人のプライバシーを保護しながら大規模な高品質データセットを使用する必要があります。JAXは高性能な数値計算ライブラリで、複雑なモデルの効率的な構築とトレーニングを可能にします。JAX-Privacyは、研究者や開発者が大規模データセットで深層学習モデルをトレーニングするための差分プライバシーアルゴリズムを迅速かつ効率的に実装できるように設計されています。新バージョンでは、最新の研究成果を統合し、モジュール性を重視して再設計されており、最先端のDPアルゴリズムとJAXのスケーラビリティを組み合わせたDPトレーニングパイプラインの構築が容易になっています。 • JAX-Privacyは、JAXライブラリ上で動作する差分プライバシー機械学習のためのツールキットである。 • AIモデルの精度はデータの質に依存し、個人のプライバシーを保護しながらデータを使用する必要がある。 • JAXは高性能な数値計算ライブラリで、複雑なモデルの効率的な構築とトレーニングを可能にする。 • JAX-Privacyは、研究者が大規模データセットで深層学習モデルをトレーニングするための差分プライバシーアルゴリズムを迅速に実装できる。 • 新バージョンでは、最新の研究成果を統合し、DPトレーニングパイプラインの構築が容易になった。
Introducing Nested Learning: A new ML paradigm for continual learning
Nested Learningは、機械学習における新しいアプローチで、モデルを小さな最適化問題の集合として捉え、各問題が独自の内部ワークフローを持つことで「破滅的忘却」の問題を軽減または回避することを目指しています。従来の手法では、モデルのアーキテクチャと最適化アルゴリズムを別々に扱っていましたが、Nested Learningではこれらを統合し、相互に関連する多層の学習問題として最適化します。この新しい視点により、より深い計算深度を持つ学習コンポーネントを設計でき、言語モデリングにおいて優れた性能を発揮し、長期的な記憶管理を改善することが示されています。 • Nested Learningは、機械学習における破滅的忘却を軽減する新しいアプローチである。 • モデルを小さな最適化問題の集合として捉え、各問題が独自の内部ワークフローを持つ。 • 従来の手法ではアーキテクチャと最適化アルゴリズムを別々に扱っていたが、Nested Learningでは統合して最適化する。 • このアプローチにより、より深い計算深度を持つ学習コンポーネントを設計できる。 • 言語モデリングにおいて優れた性能を示し、長期的な記憶管理を改善する。
DS-STAR: A state-of-the-art versatile data science agent
DS-STARは、データサイエンスのさまざまなタスクを自動化する最先端のエージェントであり、統計分析から可視化、データ処理まで幅広く対応します。このエージェントは、DABStepベンチマークでの優れたパフォーマンスを示しています。データサイエンスは、膨大なデータを意味のある洞察に変換する重要な分野ですが、プロセスは複雑で専門知識を必要とします。DS-STARは、自然言語の質問を実行可能なコードに変換する自律的なデータサイエンスエージェントを目指しています。DS-STARは、(1)さまざまなデータ形式から文脈を自動的に抽出するデータファイル分析モジュール、(2)各ステップの計画の十分性を評価するLLMベースの検証ステージ、(3)フィードバックに基づいて初期計画を反復的に洗練するプロセスを導入しています。これにより、DS-STARは複雑な分析を行い、複数のデータソースから検証可能な洞察を引き出すことができます。 • DS-STARはデータサイエンスのタスクを自動化するエージェントである。 • 統計分析、可視化、データ処理など、さまざまなデータ形式に対応。 • DABStepベンチマークでの優れたパフォーマンスを示す。 • データファイル分析モジュールが多様なデータ形式から文脈を抽出。 • LLMベースの検証ステージが計画の十分性を評価。 • フィードバックに基づく反復的な計画プロセスを採用。 • 複数のデータソースからの検証可能な洞察を提供。
Forecasting the future of forests with AI: From counting losses to predicting risk
この記事では、AIを活用した初の深層学習ベンチマーク「ForestCast」を紹介し、森林伐採リスクの予測に関する新たなアプローチを提案しています。森林は気候や生態系において重要な役割を果たしていますが、世界中で急速に失われています。従来の手法は過去のデータに基づいていましたが、ForestCastは衛星データを用いて未来のリスクを予測することを目指しています。この新しいアプローチは、地域に依存せず、将来的にデータが更新されても適用可能です。記事では、森林伐採の予測が難しい理由や、従来の手法の限界についても触れています。最終的に、すべてのデータを公開し、コミュニティがこの研究を再現し、発展させることを目指しています。 • 森林伐採リスクの予測に関する新しい深層学習ベンチマーク「ForestCast」を発表 • 従来の手法は過去のデータに依存していたが、未来のリスクを予測することが可能に • 衛星データを用いた純粋なアプローチで、地域に依存せず、将来的にデータが更新可能 • 従来の手法は入力マップが不完全で、地域ごとに別々に組み立てる必要があった • 新しいアプローチは、精度が向上し、再現性が高い • 森林伐採の予測が難しい理由として、経済的、政治的、環境的要因の複雑さを挙げている • すべてのデータを公開し、コミュニティが研究を再現しやすくすることを目指している
Exploring a space-based, scalable AI infrastructure system design
この記事では、太陽光発電の衛星コンステレーションを用いたスケーラブルなAIインフラシステムの設計について探求しています。プロジェクトSuncatcherは、TPUを搭載した衛星が自由空間光リンクで接続され、宇宙での機械学習計算を拡張することを目指しています。太陽は地球上の電力生産の100兆倍以上のエネルギーを放出し、適切な軌道では太陽光パネルが地上の8倍の生産性を持つことができます。このシステムは、ネットワーク化された衛星のコンステレーションで構成され、データセンター規模のインターサテライトリンクを実現するための技術的課題に取り組んでいます。特に、数十テラビット毎秒の通信を可能にするために、衛星を非常に近いフォーメーションで飛行させる必要があります。初期の研究成果は、800 Gbpsの双方向伝送を達成したことを示しています。 • 太陽光発電の衛星コンステレーションを用いたAIインフラの設計 • TPUを搭載した衛星が自由空間光リンクで接続される • 太陽は地球上の電力生産の100兆倍以上のエネルギーを放出 • 衛星はデータセンター規模のインターサテライトリンクを実現する必要がある • 数十テラビット毎秒の通信を可能にするため、衛星を近いフォーメーションで飛行させる • 初期の研究で800 Gbpsの双方向伝送を達成した
Accelerating the magic cycle of research breakthroughs and real-world applications
この記事では、Google Researchが発表した最新の科学的ブレークスルーと、それらがどのようにAIツールやプラットフォームによって革新を加速しているかについて述べています。特に、Google Earth AI、DeepSomatic、Quantum Echoesの3つのブレークスルーが強調されており、これらは地球科学、ゲノム学、量子コンピューティングの分野での進展を示しています。Earth AIは、地球上の重要な課題に対処するための地理空間AIモデルの集まりであり、ユーザーに前例のないレベルの理解を提供します。DeepSomaticは、がん治療のための精密医療を目指したAIツールであり、科学コミュニティや医療従事者を支援します。これらの研究は、実世界のソリューションを加速し、研究と実世界の影響との間の強力な循環関係を形成しています。 • Google Researchが最新の科学的ブレークスルーを発表した。 • Earth AIは地理空間AIモデルを用いて、地球上の重要な課題に対処する。 • DeepSomaticはがん治療のための精密医療を目指したAIツールである。 • AIツールが研究と実世界の影響を加速する循環関係を形成している。 • Google Earth AIは、ユーザーが複雑な質問をし、平易な言葉で回答を得ることを可能にする。
Toward provably private insights into AI use
この記事では、機密性の高いフェデレーテッドアナリティクス技術を活用して、デバイス上の生成AI機能に関する洞察を得る方法について詳述しています。特に、個々のデータが検査されず、集約された洞察が匿名であることを保証する新しい「証明可能なプライベートインサイト(PPI)」システムを紹介しています。このシステムは、大規模言語モデル(LLM)、差分プライバシー(DP)、および信頼できる実行環境(TEE)を利用して、非構造化データを分析します。具体的には、ユーザーのデバイスが分析のためにアップロードするデータを暗号化し、サーバー側でのプライバシーを保護しながら処理を行います。GoogleのRecorderアプリケーションにおいて、Gemmaモデルを使用してRecorderの使用状況に関する洞察を提供することが実施されています。また、外部コミュニティが主張を検証できるように、プライバシーを保護する洞察をオープンソースとして公開しています。 • 機密性の高いフェデレーテッドアナリティクス技術を使用して、デバイス上の生成AI機能に関する洞察を得ることができる。 • 新しい証明可能なプライベートインサイト(PPI)システムを導入し、個々のデータが検査されず、集約された洞察が匿名であることを保証。 • 大規模言語モデル(LLM)、差分プライバシー(DP)、信頼できる実行環境(TEE)を活用して非構造化データを分析。 • ユーザーのデバイスが分析のためにアップロードするデータを暗号化し、プライバシーを保護しながら処理を行う。 • GoogleのRecorderアプリケーションでGemmaモデルを使用して、Recorderの使用状況に関する洞察を提供。 • プライバシーを保護する洞察をオープンソースとして公開し、外部コミュニティが検証できるようにしている。
StreetReaderAI: Towards making street view accessible via context-aware multimodal AI
StreetReaderAIは、文脈に応じたリアルタイムAIを使用して、ストリートビューをアクセシブルにする新しいプロトタイプです。このシステムは、視覚障害者や低視力者がGoogleストリートビューの2200億以上の画像をよりアクセスしやすくすることを目指しています。StreetReaderAIは、周囲の道路や交差点、場所のリアルタイムで生成された説明を提供し、音声コマンドやキーボードショートカットを使用してパノラマ画像間を移動できます。ユーザーは、音声インターフェースを通じて周囲を探索し、現在の方位や近くのランドマークについての情報を得ることができます。AI DescriberとAI Chatという2つのAIサブシステムが、ユーザーの現在地に基づいた情報を提供し、インタラクティブな会話を可能にします。 • 視覚障害者向けにストリートビューをアクセシブルにすることを目的としている。 • リアルタイムAIによる周囲の道路や場所の説明を提供。 • 音声コマンドやキーボードショートカットでのナビゲーションが可能。 • ユーザーは音声インターフェースを通じて周囲を探索できる。 • AI DescriberとAI Chatの2つのAIサブシステムが情報を提供。
How we are building the personal health coach
この記事では、Googleが開発中のパーソナルヘルスコーチについて説明しています。このコーチは、Geminiモデルを活用して、科学に基づいたパーソナライズされたコーチングを提供します。従来の健康管理アプリは断片的で一般的な情報しか提供せず、ユーザーが専門家とつながる手助けをしないことが多いですが、この新しいコーチは、睡眠、フィットネス、健康に関するプロアクティブなインサイトを提供し、行動科学に基づいた個別のガイダンスを行います。ユーザーは、Fitbitデータへのアクセスを許可することで、パーソナライズされたインサイトを受け取ることができます。コーチは、ユーザーの生理データを分析し、個別のフィットネスプランを生成するために、複数のエージェントを活用しています。 • 従来の健康管理アプリは断片的で一般的な情報しか提供しない問題を解決する。 • Geminiモデルを使用して、科学に基づいたパーソナライズされたコーチングを提供する。 • ユーザーのFitbitデータを基に、睡眠やフィットネスに関するプロアクティブなインサイトを提供する。 • 行動科学に基づいた個別のガイダンスを行い、持続可能な習慣を構築するための計画を提供する。 • 複数のエージェントを活用して、ユーザーの生理データを分析し、個別のフィットネスプランを生成する。
Google Earth AI: Unlocking geospatial insights with foundation models and cross-modal reasoning
Google Earth AIは、地理空間AIモデルと推論エージェントのファミリーであり、ユーザーに実世界の理解に基づいた実用的な洞察を提供します。Googleは、衛星画像を分析してMapsの正確性を保ち、Searchユーザーに最新の天候や自然災害の警告を提供するためにAIモデルを開発してきました。Google Earth AIは、複雑な質問に対する回答を可能にするために、強力な基盤モデルと地理空間推論エージェントを組み合わせています。このエージェントは、複雑な質問を多段階の計画に分解し、基盤モデルを呼び出して実行し、結果を統合して全体的な回答を提供します。新たに導入されたImageryとPopulationの基盤モデルは、衛星画像分析を簡素化し、迅速かつ正確な回答を提供します。これにより、ユーザーは自然言語でのクエリを通じて、例えば「洪水後の画像で全ての洪水した道路を見つける」といった質問が可能になります。 • Google Earth AIは、地理空間AIモデルと推論エージェントを提供し、実世界の理解に基づいた洞察を提供する。 • 複雑な質問に対する回答を可能にするために、基盤モデルと地理空間推論エージェントを組み合わせている。 • 新しいImageryとPopulationの基盤モデルは、衛星画像分析を簡素化し、迅速かつ正確な回答を提供する。 • ユーザーは自然言語でのクエリを通じて、特定の情報を迅速に取得できる。 • 新しいモデルは、複数の公的地球観測ベンチマークで最先端の結果を達成している。
A verifiable quantum advantage
本記事では、Google Quantum AIの研究者が発表した新しい量子計算タスク「Out-of-Time-Order Correlators(OTOCs)」について紹介しています。この研究は、実証可能な量子優位性を示し、核磁気共鳴(NMR)におけるハミルトニアン学習などの現実の問題を解決する道を開くものです。量子系におけるカオスの特性を利用し、量子エコーアルゴリズムを用いてOTOCを測定する手法を実験的に示しました。OTOCは、量子ダイナミクスがカオス的になる様子を記述する新しい観測量であり、異なる量子コンピュータで実行しても同じ結果が得られるため、実用的な応用が期待されます。実験では、103量子ビットを用いて、前進および後退の進化を行い、カオス的な状態を生成しました。 • 量子計算における新しいタスクOTOCの導入 • 実証可能な量子優位性の実現 • 量子エコーアルゴリズムの実験的デモ • OTOCは量子ダイナミクスのカオス性を記述する新しい観測量 • 異なる量子コンピュータで同じ結果が得られるため実用性が高い • 103量子ビットを用いた実験でカオス的状態を生成
A picture's worth a thousand (private) words: Hierarchical generation of coherent synthetic photo albums
この記事では、差分プライバシーを利用した合成写真アルバムの生成手法を紹介しています。この手法は、中間的なテキスト表現を使用し、階層的にアルバムを生成します。差分プライバシーは、データセット内の個人情報を保護するための強力な手段であり、生成AIモデルを用いることで、個別の分析手法を変更することなく、プライベートな合成データセットを作成できます。具体的には、元のデータセットに基づいて、AIモデルを用いてアルバムの要約と各写真の詳細なキャプションを生成し、テーマの一貫性を保ちながら合成アルバムを作成します。この方法により、複雑なデータを扱う際の課題を解決し、効果的な分析やモデリングが可能になります。 • 差分プライバシーを利用した合成写真アルバムの生成手法を提案 • 中間的なテキスト表現を使用し、階層的にデータを生成 • AIモデルを用いてアルバムの要約と各写真のキャプションを生成 • テーマの一貫性を保ちながら合成アルバムを作成 • プライベートな合成データセットを生成することで、分析手法の簡素化を実現
Teaching Gemini to spot exploding stars with just a few examples
この記事では、GoogleのGeminiモデルがどのようにして高精度の天文学アシスタントに変身し、超新星などの宇宙イベントを分類できるかを示しています。Geminiは、各調査ごとにわずか15の注釈付き例から学習し、3つのデータセットで93%の精度を達成しました。従来の機械学習モデルは「ブラックボックス」として機能し、結果に対する説明を提供しませんでしたが、Geminiはその理由を平易な言葉で説明することができます。少数の例から学ぶ手法を用い、各調査に対して15の注釈付き例と簡潔な指示を提供することで、宇宙イベントを正確に分類し説明する能力を獲得しました。 • GoogleのGeminiモデルは、宇宙イベントを高精度で分類し、その理由を説明できる。 • 93%の精度を達成するために、各調査ごとに15の注釈付き例を使用した。 • 従来のモデルは結果を説明しないが、Geminiは平易な言葉でその理由を説明する。 • 少数の例から学ぶ手法(few-shot learning)を採用し、効率的に学習を行った。 • 異なる解像度やピクセルスケールを持つ複数の天文調査からのデータを扱うことができる。
Solving virtual machine puzzles: How AI is optimizing cloud computing
この記事では、LAVAという新しいスケジューリングアルゴリズムを紹介し、クラウドデータセンターにおける仮想マシン(VM)のリソース効率を最適化する方法を説明しています。LAVAは、VMの実際の寿命を継続的に再予測し、適応することで、リソースの無駄を減らします。VMの寿命は予測が難しく、短命のVMが多く存在する一方で、長命のVMがリソースを多く消費するため、効率的な配置が求められます。LAVAは、非侵襲的寿命認識スコアリング(NILAS)、寿命認識VM割り当て(LAVA)、寿命認識再スケジューリング(LARS)の3つのアルゴリズムを用いて、VMを物理サーバーに効率的に配置するための解決策を提供します。これにより、リソースのストランディングを防ぎ、システムの更新やリソース集約型VMのプロビジョニングに必要な空きホストを確保します。 • LAVAはVMの実際の寿命を継続的に再予測し、リソース効率を最適化するスケジューリングアルゴリズムである。 • VMの寿命は予測が難しく、短命のVMが多く、長命のVMがリソースを多く消費するため、効率的な配置が重要である。 • LAVAはNILAS、LAVA、LARSの3つのアルゴリズムを使用して、VMを物理サーバーに効率的に配置する。 • このシステムは、VMの寿命を一度の予測に依存せず、実行中に予測を自動的に更新する。 • リソースのストランディングを防ぎ、システムの更新やリソース集約型VMのプロビジョニングに必要な空きホストを確保する。
Using AI to identify genetic variants in tumors with DeepSomatic
DeepSomaticは、腫瘍の遺伝子配列における癌関連の変異を特定するためのAI駆動ツールです。癌は遺伝的な病気であり、腫瘍細胞の遺伝子変異を特定することは治療計画を立てる上で重要です。DeepSomaticは、畳み込みニューラルネットワークを使用して、腫瘍細胞の遺伝子変異をより正確に特定します。このツールは、主要なシーケンシングプラットフォームからのデータに対応し、異なるサンプル処理のタイプにも適応可能です。また、トレーニングに含まれていない癌タイプにも学習を拡張できます。Google Researchは、癌の理解を深め、治療法を開発するためにAI技術を活用しており、DeepSomaticはその一環として提供されています。 • DeepSomaticは腫瘍の遺伝子変異を特定するAIツールである。 • 癌は遺伝的な病気であり、遺伝子変異の特定が治療計画に重要である。 • DeepSomaticは畳み込みニューラルネットワークを使用して、腫瘍細胞の変異を正確に特定する。 • このツールは主要なシーケンシングプラットフォームに対応し、異なるサンプル処理にも適応可能。 • DeepSomaticは、トレーニングに含まれていない癌タイプにも学習を拡張できる。 • Google Researchは癌研究を進めるためにAI技術を活用している。
Coral NPU: A full-stack platform for Edge AI
Coral NPUは、低消費電力のエッジAIデバイス向けに設計されたフルスタックのオープンソースプラットフォームです。このプラットフォームは、パフォーマンス、断片化、プライバシーの課題を解決することを目的としています。AIが私たちの生活を支援するためには、クラウドから個人のデバイスに埋め込まれる必要がありますが、これにはいくつかの重要な問題があります。まず、複雑な機械学習モデルはエッジデバイスの限られたリソースを超えるため、パフォーマンスのギャップが生じます。次に、異なるプロセッサ向けにモデルを最適化することが難しく、断片化が進みます。最後に、個人データのプライバシーとセキュリティが重要です。Coral NPUは、これらの課題に対処するために、AIファーストのハードウェアアーキテクチャを提供し、開発者が効率的なエッジAIデバイスを構築できるようにします。 • エッジAIデバイスのパフォーマンス、断片化、プライバシーの課題を解決するプラットフォーム • AIを個人デバイスに埋め込む必要性 • 複雑な機械学習モデルがエッジデバイスのリソースを超える問題 • 異なるプロセッサ向けのモデル最適化の難しさ • 個人データのプライバシーとセキュリティの重要性 • AIファーストのハードウェアアーキテクチャを提供 • 開発者が効率的なエッジAIデバイスを構築するためのツールを提供