Google Research
research.google/blog/
How Google’s AI can help transform health professions education
この記事では、GoogleのAIモデルが医療教育においてどのように役立つかを探求しています。特に、医療専門職の教育におけるAIの活用が、2023年までに1100万人以上の医療従事者が不足するという予測に対処する手段として注目されています。2つの研究が紹介されており、1つ目は医療学生とAIチューターを用いた臨床推論のケーススタディで、AIツールが学習者に適応し、建設的なフィードバックを提供する能力が評価されています。2つ目は、LearnLMというGeminiベースのモデルが医療教育シナリオでの効果を定量的に評価したもので、医療教育者から高い評価を得ています。これらの研究は、AIが個別化された学習経路を拡張し、能力に基づくアプローチを補完する可能性を示しています。 • 医療専門職の教育におけるAIの活用が、医療従事者不足の問題に対処する手段として注目されている。 • AIツールは学習者に適応し、建設的なフィードバックを提供する能力が求められている。 • LearnLMはGeminiベースのモデルで、医療教育シナリオにおいて高い評価を得ている。 • 医療学習者のニーズを理解するために、UXリサーチと共同設計ワークショップが実施された。 • AIチューターは、臨床推論を支援するために設計され、学習者の個別の学習スタイルに適応することが期待されている。

A scalable framework for evaluating health language models
本記事では、健康分野における言語モデルの評価のための新しい適応型評価フレームワークを提案しています。従来の評価方法は人間の専門家に依存しており、コストが高く、労力がかかり、スケーラブルではありません。提案されたフレームワークは、複雑な評価質問を単純な二項応答(はい/いいえ)に分解することで、評価の一貫性と効率を向上させることを目的としています。具体的には、適応型精密ブールルブリックを導入し、健康データを考慮した評価を行います。この方法は、メタボリックヘルスの領域で検証され、ユーザーの健康情報に基づくパーソナライズされた応答の精度を高めることが期待されています。 • 健康分野における言語モデルの評価は高コストで労力がかかる。 • 新しい適応型評価フレームワークを提案し、評価の効率と一貫性を向上させる。 • 複雑な評価質問を単純な二項応答に分解することで、評価の精度を高める。 • 適応型精密ブールルブリックを導入し、健康データを考慮した評価を行う。 • メタボリックヘルスの領域での検証を行い、パーソナライズされた応答の精度向上を目指す。

From massive models to mobile magic: The tech behind YouTube real-time generative AI effects
この記事では、YouTubeがモバイルデバイス上でリアルタイムの生成AIエフェクトを提供するための技術について詳述しています。大規模な生成モデルの能力を小型化し、特定のタスクに特化したモデルを作成することで、計算制限を克服しつつユーザーのアイデンティティを保つ方法を説明しています。具体的には、データのキュレーション、トレーニング、デバイス上のセットアップを含むパイプラインを構築し、20以上のリアルタイムエフェクトをYouTube Shortsのクリエイター向けに展開しました。高品質なデータセットを使用し、知識蒸留の手法を用いて、教師モデルから学生モデルへと効率的に学習させるプロセスを採用しています。最終的に、モバイルデバイスで動作する小型で高速なモデルを設計し、リアルタイムでの映像変換を実現しています。 • YouTubeはモバイルデバイスでリアルタイムの生成AIエフェクトを提供する技術を開発した。 • 大規模モデルの能力を小型化し、特定のタスクに特化したモデルを作成することで計算制限を克服した。 • 高品質なデータセットを使用し、性別、年齢、肌色の多様性を考慮したデータを構築した。 • 知識蒸留を用いて、教師モデルから学生モデルへと効率的に学習させる手法を採用した。 • モバイルデバイス向けに設計された小型で高速なUNetベースのモデルを使用している。

Securing private data at scale with differentially private partition selection
本記事では、ユーザープライバシーを保護するための新しいアルゴリズムを提案し、差分プライバシーに基づくパーティション選択の最先端を改善する方法を紹介しています。大規模なユーザーデータセットはAIや機械学習モデルの進展に不可欠ですが、データプライバシーのリスクも伴います。差分プライバシーを適用することで、個々のデータが特定のアイテムに寄与したかどうかを知られないようにしつつ、意味のあるアイテムのサブセットを安全に共有することが可能です。特に、並列アルゴリズムを用いることで、数百億のアイテムを含むデータセットを効率的に処理し、プライバシーを確保しながらもデータの有用性を損なわないことができます。最近の研究では、ICML2025で発表された「スケーラブルなプライベートパーティション選択に関する適応重み付け」を通じて、最適なプライバシーと有用性のトレードオフを実現する効率的なアルゴリズムを紹介しています。 • ユーザープライバシーを保護するための新しいアルゴリズムを提案 • 差分プライバシーに基づくパーティション選択の改善 • 大規模データセットのプライバシーリスクに対処 • 並列アルゴリズムを用いて数百億のアイテムを効率的に処理 • プライバシーを確保しつつデータの有用性を維持 • 最適なプライバシーと有用性のトレードオフを実現 • GitHubでのオープンソース化を通じて研究コミュニティの協力を促進

Beyond billion-parameter burdens: Unlocking data synthesis with a conditional generator
この記事では、プライバシーを保護した合成データ生成のための新しいアルゴリズムCTCL(Data Synthesis with ConTrollability and CLustering)を提案しています。このアルゴリズムは、リソースが制約されたAIアプリケーションでも利用可能で、ビリオン規模の大規模言語モデル(LLM)を微調整することなく、トピック情報に基づいて合成データを生成します。CTCLは、140百万パラメータの軽量モデルを使用し、プライベートドメインのトピック分布に合った合成データを生成します。従来のAug-PEアルゴリズムと異なり、追加のプライバシーコストなしで無限の合成データサンプルを生成できる点が特徴です。CTCLは多様なデータセットで評価され、特に強いプライバシー保証の下でベースラインを一貫して上回る性能を示しました。 • プライバシーを保護した合成データ生成の課題を解決する新しいアルゴリズムCTCLを提案 • CTCLは140百万パラメータの軽量モデルを使用し、リソース制約のあるアプリケーションでも実用的 • トピック情報に基づいて合成データを生成し、プライベートドメインのトピック分布にマッチさせる • 従来の方法に比べて追加のプライバシーコストなしで無限の合成データを生成可能 • 多様なデータセットでの評価により、強いプライバシー保証の下での性能向上が確認された

Enabling physician-centered oversight for AMIE
この記事では、医師中心の監視を可能にするために設計された診断AI「guardrailed-AMIE(g-AMIE)」について紹介しています。g-AMIEは、個別の医療アドバイスを提供することを禁止するガードレールを持ち、医師がレビューするための要約を生成します。従来のAMIEシステムは、患者訪問のテキストベースのシミュレーションで正確な医療アドバイスを提供できることが示されていますが、個々の患者の診断や治療計画は、ライセンスを持つ医療専門家によるレビューと承認が必要です。g-AMIEは、患者情報を対話形式で収集し、医師がレビューするための情報を生成します。これには、収集した情報の要約、提案された鑑別診断および管理計画、患者へのメッセージの草案が含まれます。g-AMIEのパフォーマンスは、看護師や医師助手と比較され、医師によるレビューの際に好まれる結果が得られました。 • g-AMIEは個別の医療アドバイスを提供せず、医師がレビューするための要約を生成する。 • 患者情報を対話形式で収集し、医師がレビューするための情報を生成する。 • g-AMIEは、提案された鑑別診断や管理計画を含む詳細な医療ノートを作成する。 • g-AMIEのパフォーマンスは、看護師や医師助手と比較して好まれる結果が得られた。 • 医師の監視を可能にするために、特別に設計されたウェブインターフェース「クリニシャンコックピット」を使用する。

Achieving 10,000x training data reduction with high-fidelity labels
この記事では、Google Adsのエンジニアリングマネージャーと研究科学者が提案する新しいアクティブラーニング手法について説明しています。この手法は、LLM(大規模言語モデル)のファインチューニングに必要なトレーニングデータを大幅に削減することができ、具体的には100,000から500未満のトレーニング例にまで減少させることが可能です。特に、広告コンテンツの安全性を評価するための高品質なデータを効率的にキュレーションするプロセスが紹介されています。このプロセスでは、初期モデルが広告をラベル付けし、その後、ラベルのクラスタリングを行い、最も情報価値の高い例を特定します。最終的に、専門家によるラベル付けを用いてモデルをファインチューニングし、モデルと人間の専門家との整合性を最大65%向上させることができるとされています。 • 新しいアクティブラーニング手法により、LLMのファインチューニングに必要なトレーニングデータを大幅に削減できる。 • トレーニングデータの量を100,000から500未満に減少させることが可能。 • 広告コンテンツの安全性を評価するための高品質なデータを効率的にキュレーションするプロセスを提案。 • 初期モデルが広告をラベル付けし、ラベルのクラスタリングを行うことで、最も情報価値の高い例を特定。 • 専門家によるラベル付けを用いてモデルをファインチューニングし、モデルと人間の専門家との整合性を最大65%向上。

Insulin resistance prediction from wearables and routine blood biomarkers
この記事では、ウェアラブルデータと日常的な血液検査を活用して、インスリン抵抗性(IR)を効果的に予測する新しい手法を提案しています。この手法は、2型糖尿病のリスクスクリーニングを早期に行うためのスケーラブルでアクセス可能なアプローチを提供します。2型糖尿病は世界中で数億人に影響を及ぼしており、その前兆としてインスリン抵抗性が重要です。従来のIR測定方法は侵襲的で高価なため、早期発見が困難でした。そこで、ウェアラブルデバイスからのデータ(安静時心拍数、歩数、睡眠パターン)と日常的な血液検査(空腹時血糖、脂質パネル)を用いてIRリスクを推定する機械学習モデルを開発しました。このアプローチは、特に肥満や運動不足の高リスク個人において強いパフォーマンスを示しました。また、インスリン抵抗性を理解するためのエージェントも紹介されており、個別の推奨を安全に行う手助けをします。 • インスリン抵抗性(IR)の早期発見が重要であること • 従来のIR測定方法は侵襲的で高価であるため、早期発見が困難 • ウェアラブルデータと日常的な血液検査を用いた新しい予測手法を提案 • 機械学習モデルがIRリスクを推定する能力を持つ • 特に肥満や運動不足の高リスク個人において強いパフォーマンスを示す • インスリン抵抗性を理解するためのエージェントを導入 • この研究は情報提供と研究目的のために設計されている

Highly accurate genome polishing with DeepPolisher: Enhancing the foundation of genomic research
DeepPolisherは、ゲノムアセンブリの精度を大幅に向上させる新しい深層学習ツールで、特にヒトパンゲノムリファレンスの改善に寄与しています。ゲノムは塩基(A、T、G、C)で構成されており、DNAシーケンサーはこれを読み取りますが、正確かつ大規模に行うことは困難です。DeepPolisherは、ゲノムアセンブリのエラーを50%削減し、挿入または削除エラー(インデル)を70%削減します。この技術は、遺伝子の特定において重要であり、エラーが多いと診断プロセスで病因変異を見逃す可能性があります。DeepPolisherは、UCサンタクルーズゲノミクス研究所との共同開発により、オープンソースのゲノムアセンブリ手法として提案されています。 • DeepPolisherはゲノムアセンブリの精度を向上させる深層学習ツールである。 • エラーを50%削減し、インデルエラーを70%削減する。 • ヒトパンゲノムリファレンスの改善に寄与している。 • ゲノムの正確なアセンブリは遺伝子やタンパク質の特定に重要である。 • オープンソースの手法として、UCサンタクルーズゲノミクス研究所と共同開発された。

MLE-STAR: A state-of-the-art machine learning engineering agents
MLE-STARは、さまざまなデータモダリティにわたる機械学習タスクを自動化できる最先端の機械学習エンジニアリングエージェントです。従来の機械学習エンジニアは、モデルの構築に多くの反復実験とデータエンジニアリングを必要とし、これが作業の負担となっています。MLE-STARは、ウェブ検索を活用して適切なモデルを見つけ、特定のコードブロックを改善することで、タスクに特化したアプローチを採用します。これにより、Kaggleコンペティションの63%でメダルを獲得し、他の手法を大きく上回る成果を上げました。MLE-STARは、各MLコンポーネントの寄与を評価するアブレーションスタディを実施し、最もパフォーマンスに影響を与えるコードブロックを特定し、反復的に改善を行います。 • MLE-STARは機械学習タスクを自動化するエージェントである。 • 従来の手法は、既存のLLM知識に依存し、特定のアプローチを見逃すことがある。 • MLE-STARはウェブ検索を利用して初期モデルを生成し、特定のコードブロックを改善する。 • アブレーションスタディを通じて、各MLコンポーネントの寄与を評価する。 • Kaggleコンペティションで63%の成功率を誇る。

Simulating large systems with Regression Language Models
この記事では、言語モデルを用いたテキストからテキストへの回帰手法を提案し、数値予測問題を解決する方法を説明しています。大規模言語モデル(LLM)は、人間の好みや評価から学ぶことで改善されており、これにより会話型アシスタントの能力が向上しています。新たなアプローチとして、運用データを処理し、観測された数値結果を報酬信号として扱うことで、ソフトウェアインフラや産業プロセスのパフォーマンス予測が可能になります。提案された回帰言語モデル(RLM)は、入力の文字列表現を読み取り、数値を構造化されたテキスト文字列として出力します。この手法は、特徴エンジニアリングや正規化を回避し、新しいタスクへの少数ショット適応を可能にします。具体的には、GoogleのBorgシステムにおけるリソース効率の予測にRLMを適用し、オープンソースライブラリも提供されています。 • 言語モデルを用いたテキストからテキストへの回帰手法を提案 • 数値予測問題を解決するための新しいアプローチ • 運用データを処理し、観測された数値結果を報酬信号として利用 • 回帰言語モデル(RLM)は入力を文字列として読み取り、数値を出力 • 特徴エンジニアリングや正規化を回避できる • 新しいタスクへの少数ショット適応が可能 • GoogleのBorgシステムにおけるリソース効率の予測に適用 • オープンソースライブラリを提供

SensorLM: Learning the language of wearable sensors
SensorLMは、ウェアラブルセンサーの信号と自然言語を結びつける新しいセンサー・ランゲージ基盤モデルのファミリーです。60万時間以上のデータを用いて訓練され、個人の健康や活動に関する深い理解を提供します。ウェアラブルデバイスは心拍数や歩数、フィットネス、睡眠などのデータを継続的に記録しますが、これらの生データの背後にある文脈が欠けていることが多く、デバイスの潜在能力を引き出す障壁となっています。SensorLMは、103,000人以上から収集した2.5M人日分のデータを用いて、センサー信号と人間の言語の複雑な関係を学習します。新しい能力として、ゼロショットセンサー理解、センサーとテキストの整合性、少数ショット学習、センサーキャプション生成が可能です。これにより、センサーからの情報を自然言語で意味のある記述に変換することができます。 • ウェアラブルデバイスからの生データとその文脈のギャップを解消する必要がある。 • SensorLMは、センサー信号と自然言語の関係を学習するためのモデルである。 • 103,000人以上からのデータを用いて、2.5M人日分のデータを収集した。 • 新しい階層的パイプラインを開発し、センサーから自動的に記述テキストを生成する。 • SensorLMは、ゼロショット理解や少数ショット学習などの新しい能力を提供する。

Synthetic and federated: Privacy-preserving domain adaptation with LLMs for mobile applications
この記事では、プライバシーを保護する合成データを用いたフェデレーテッドラーニング(FL)が、モバイルアプリケーションにおける大規模言語モデル(LLM)と小規模言語モデル(LM)の両方の改善に寄与することが述べられています。特に、Gboardにおけるユーザーのタイピング体験を向上させるための実用的な応用が紹介されています。合成データは、ユーザーのインタラクションデータを模倣することで、プライバシーリスクを最小限に抑えつつモデルのトレーニングに利用されます。Gboardでは、小規模LMが基本機能を支え、大規模LMが高度な機能を提供しています。最近の研究では、プライバシーを保護する合成データの生成と利用が進展しており、FLと差分プライバシー(DP)を活用して、ユーザーデータのプライバシーを確保しながらモデルの適応が行われています。 • プライバシーを保護する合成データが、モバイルアプリケーションの言語モデルの改善に寄与する。 • Gboardにおけるユーザーのタイピング体験を向上させるための実用的な応用がある。 • 合成データはユーザーのインタラクションデータを模倣し、プライバシーリスクを最小限に抑える。 • 小規模LMは基本機能を、大規模LMは高度な機能を提供する。 • FLと差分プライバシーを活用して、ユーザーデータのプライバシーを確保しながらモデルの適応が行われている。

LSM-2: Learning from incomplete wearable sensor data
LSM-2は、Wearableセンサーからの不完全なデータを直接学習する新しい自己教師あり学習手法であるAdaptive and Inherited Masking(AIM)を導入します。この手法は、分類、回帰、生成タスクにおいて強力なパフォーマンスを発揮し、明示的な補完なしで機能します。ウェアラブルデバイスは、心拍信号や睡眠パターンなどの生理的および行動データを提供しますが、データのラベリングコストが高く、自己教師あり学習がこの制約を克服します。従来の手法は完全なデータを前提としていますが、AIMはデータの欠損を自然な現象として扱い、欠損部分を埋めるのではなく、直接学習します。これにより、LSM-2はセンサーの故障や時間的ウィンドウの削除があっても強力なパフォーマンスを維持します。 • Wearableセンサーからの不完全なデータを直接学習する手法を提案 • Adaptive and Inherited Masking(AIM)を用いて欠損データを自然な現象として扱う • 従来の補完手法に依存せず、データの欠損を学習に活用 • LSM-2は、以前のモデルLSM-1を改善し、強力なパフォーマンスを実現 • 欠損データがあってもパフォーマンスの劣化が少ない

Measuring heart rate with consumer ultra-wideband radar
この記事では、消費者向けの超広帯域(UWB)レーダーを用いた非接触型心拍数モニタリングの可能性について述べています。Googleの研究者たちは、UWB技術が既存のモバイルデバイスに搭載されていることを活かし、心拍数を測定する新しい手法を提案しています。これまでUWBは主に位置情報やデータ転送に利用されてきましたが、心拍数測定においてもその能力を活用できることが示されています。心拍数を非接触で測定する際の課題として、呼吸や体の動きによる影響が挙げられますが、UWBレーダーは高い空間分解能と時間分解能を持ち、これを克服することが可能です。新たに開発された手法は、FMCWレーダーから学んだ特徴をUWBレーダーに転送することで、心拍数の高精度な測定を実現しています。 • UWB技術を用いた非接触型心拍数モニタリングの研究 • FMCWレーダーからの特徴転送によるUWBレーダーの活用 • 心拍数測定における呼吸や体の動きの影響を克服する方法 • 高い空間分解能と時間分解能を持つUWBレーダーの特性 • 既存のモバイルデバイスに搭載されているUWB技術の利点

MedGemma: Our most capable open models for health AI development
MedGemmaは、ヘルスAI開発のための最も強力なオープンモデルのコレクションであり、最近新たに発表されたマルチモーダルモデルを含んでいます。これらのモデルは、医療のワークフロー管理、患者コミュニケーション、診断および治療支援を向上させるために設計されています。特に、Health AI Developer Foundations(HAI-DEF)として知られる軽量オープンモデルのコレクションは、開発者がプライバシーやインフラを完全に制御できるようにしています。新たに追加されたMedGemma 27B Multimodalモデルは、複雑なマルチモーダルおよび縦断的電子健康記録の解釈をサポートし、MedSigLIPは分類や検索タスクのための軽量な画像およびテキストエンコーダーです。これらのモデルは、医療研究や製品開発の強力な出発点となり、特に医療テキストや画像タスクにおいて高い性能を発揮します。 • MedGemmaはヘルスAI開発のためのオープンモデルのコレクションである。 • HAI-DEFは開発者がプライバシーを制御できる軽量オープンモデルの集まり。 • 新たに発表されたMedGemma 27B Multimodalモデルは、複雑な電子健康記録の解釈をサポート。 • MedSigLIPは分類や検索タスクのための軽量なエンコーダー。 • MedGemma 4Bは医療画像分類タスクで競争力のある性能を示す。 • MedGemma 27Bモデルは、医療知識と推論のベンチマークで高いスコアを記録。 • 全てのモデルは単一のGPUで実行可能で、モバイルハードウェアにも適応可能。

REGEN: Empowering personalized recommendations with natural language
REGENは、自然言語によるインタラクションを通じて、より文脈に即した推薦を提供するための新しいベンチマークデータセットです。従来の推薦システムは、ユーザーの過去のインタラクションに基づいて次に好まれるアイテムを予測することに焦点を当てていましたが、REGENはユーザーのニーズを理解し、自然言語のフィードバックを通じて適応し、推薦の理由を説明することを目指しています。このデータセットは、Amazonの製品レビューを基に、合成されたユーザー批評や購入理由、製品の推薦を含むナラティブを組み込んでいます。実験の結果、REGENデータセットで訓練された大規模言語モデル(LLM)は、推薦と文脈に即したナラティブを効果的に生成し、最先端の推薦システムと同等のパフォーマンスを達成しました。 • REGENは、ユーザーのニーズを理解し、自然言語のフィードバックに適応する推薦システムを目指す。 • データセットは、Amazon製品レビューを基に、合成されたユーザー批評とナラティブを組み込んでいる。 • 批評は、ユーザーが好みを表現し、システムを誘導するための重要な要素である。 • ナラティブは、推薦されたアイテムに関する豊富な文脈情報を提供し、ユーザー体験を向上させる。 • REGENデータセットで訓練されたLLMは、推薦と文脈に即したナラティブを生成し、最先端のモデルと同等のパフォーマンスを示した。

MUVERA: Making multi-vector retrieval as fast as single-vector search
MUVERAは、複雑なマルチベクトル検索を単一ベクトルの最大内積検索に戻す最先端の検索アルゴリズムです。情報検索(IR)の分野では、ユーザーのクエリに対して関連情報を見つけることが求められます。従来の埋め込みモデルは、データポイントを単一ベクトルに変換し、内積類似度を用いて効率的に検索を行いますが、マルチベクトルモデルはより豊かな関係を捉えることができます。しかし、マルチベクトルアプローチは計算コストが高くなるという課題があります。MUVERAでは、固定次元エンコーディング(FDE)を用いて、マルチベクトル検索を単純な問題に変換し、効率的な検索を実現します。この手法により、初期候補を取得し、その後に正確なマルチベクトル類似度で再ランク付けすることが可能になります。 • MUVERAはマルチベクトル検索を単一ベクトルの最大内積検索に変換するアルゴリズム。 • 情報検索において、ユーザーのクエリに関連する情報を見つけることが目的。 • 従来の埋め込みモデルは単一ベクトルを使用し、内積類似度で検索を行う。 • マルチベクトルモデルは複数の埋め込みを生成し、より豊かな関係を捉えるが、計算コストが高い。 • MUVERAは固定次元エンコーディングを用いて、マルチベクトル検索の効率を向上させる。 • 初期候補を取得後、正確なマルチベクトル類似度で再ランク付けする。 • オープンソースのFDE構築アルゴリズムがGitHubで提供されている。

From research to climate resilience
Google Researchは、気候関連の脅威に対するコミュニティのレジリエンスを高めるためにAIの革新を推進しています。特に、洪水予測やサイクロン予測の精度向上に取り組んでおり、AIを活用したグローバルな水文学モデルにより、世界中の河川洪水を最大7日前に予測できるようになりました。この予測はGoogleのFlood Hubプラットフォームで提供され、1億人以上の人々を支援しています。また、サイクロンの予測においても、AIを用いて最大15日前に50のシナリオを生成することが可能になり、米国国立ハリケーンセンターとの連携を通じて、より早い警告を提供することを目指しています。これらの取り組みは、気候危機に対するコミュニティの準備と対応を強化することに寄与しています。 • Google Researchは気候関連の脅威に対するレジリエンスを高めるためにAIを活用している。 • AIを用いた洪水予測モデルにより、最大7日前に河川洪水を予測可能。 • Flood Hubプラットフォームを通じて、700万人以上の人々に情報を提供。 • AIを用いてデータが不足している地域のために「バーチャルゲージ」を作成。 • サイクロンの予測精度を向上させるためにAIを活用し、最大15日前に50のシナリオを生成。 • 米国国立ハリケーンセンターと連携し、より早い警告を提供することを目指している。

Unlocking rich genetic insights through multimodal AI with M-REGLE
M-REGLE(Multimodal REpresentation learning for Genetic discovery on Low-dimensional Embeddings)は、複数の健康データストリームを同時に分析するAI手法です。この手法は、異なるデータタイプから共同で学習することで、より豊かな表現を生成し、病気に関連する遺伝的リンクの発見を大幅に促進します。M-REGLEは、心臓の電気活動を測定するECGや血液量の変化を追跡するPPGなど、異なる生理学的データを統合し、心臓の健康状態をより完全に評価します。従来のREGLEは単一のデータタイプに基づいていましたが、M-REGLEは複数の臨床データを同時に分析することで、再構成誤差を低減し、遺伝的関連をより多く特定し、心疾患のリスクスコアを向上させます。M-REGLEは、共同学習を用いた多段階アプローチを採用し、複数のデータストリームから圧縮された「シグネチャー」を学習します。 • M-REGLEは複数の健康データを同時に分析するAI手法である。 • 異なるデータタイプから共同で学習することで、遺伝的リンクの発見を促進する。 • 心臓の健康を評価するためにECGとPPGデータを統合する。 • M-REGLEは再構成誤差を低減し、遺伝的関連をより多く特定する。 • 心疾患のリスクスコアを向上させる。 • 共同学習を用いた多段階アプローチを採用している。

A colorful quantum future
この記事では、超伝導キュービットプラットフォーム上での量子誤り訂正のための「カラ―コード」の実装結果が紹介されています。量子コンピュータの大規模化において、誤り訂正は重要な要素であり、物理キュービットを組み合わせて、ノイズに対してより堅牢な論理キュービットを形成します。最近、表面コードによる量子誤り訂正実験が成功し、論理キュービットの生成が可能になりました。次のステップとして、物理キュービットの数を最小化し、論理操作の速度を最大化する方法が模索されています。カラ―コードは、物理キュービットをより効率的に使用し、論理ゲートの効率を向上させることができる代替手段として実験的に示されました。カラ―コードは、三角形のパターンを使用し、同じ距離のコードに対して必要な物理キュービットが少なくて済む一方で、実装が難しいというトレードオフがあります。 • 量子コンピュータの大規模化における誤り訂正の重要性 • 物理キュービットを組み合わせて論理キュービットを形成する手法 • カラ―コードの実装による物理キュービットの効率的な使用 • カラ―コードは表面コードに比べて論理ゲートが効率的 • カラ―コードの実装には難しさが伴う • 最近の研究成果により、Willowチップとカラ―コードの組み合わせが示された

Optimizing LLM-based trip planning
この記事では、LLM(大規模言語モデル)を用いた旅行計画の最適化手法について説明しています。旅行計画には、予算やスケジュールといった定量的な制約と、ユーザーの好みなどの定性的な目標が含まれます。LLMは、ユーザーの好みを考慮した旅行プランを提案する能力がありますが、定量的な制約を扱うのは難しいため、実用的なプランを生成するためには、最適化アルゴリズムが必要です。提案されたハイブリッドシステムでは、LLMが初期プランを生成し、その後、実際の制約を考慮して最適化を行います。具体的には、最新のGeminiモデルを使用してユーザーのクエリに基づく初期プランを作成し、開店時間や移動時間を考慮して最終的な旅程を生成します。 • 旅行計画には定量的な制約(予算、スケジュール)と定性的な目標(ユーザーの好み)がある。 • LLMはユーザーの好みを考慮した旅行プランを提案できるが、定量的な制約には弱い。 • ハイブリッドシステムを用いて、LLMによる初期プランと最適化アルゴリズムを組み合わせて実用的な旅程を生成する。 • 初期プランはLLMが生成し、実際の開店時間や移動時間を考慮して最適化を行う。 • 最適化アルゴリズムは、初期プランの類似性と実現可能性を評価し、最終的な旅程を決定する。

Zooming in: Efficient regional environmental risk assessment with generative AI
本記事では、物理ベースの気候モデルと人工知能を組み合わせた新しい手法を提案し、地域の環境リスクを効率的に評価する方法を紹介しています。この手法は、従来の技術よりも将来の環境見通しにおける不確実性を包括的に評価することを可能にします。特に、従来の地球システムモデルは高解像度での計算コストが高く、地域レベルの予測が難しいため、都市レベルの詳細な予測が求められています。提案されたダイナミカル・ジェネレーティブ・ダウンスケーリング法は、確率的拡散モデルを用いて、グローバルな気候予測をローカルな環境リスク評価に変換します。この方法は、既存の最先端技術に比べて、はるかに低コストで詳細な地域環境リスク評価を提供します。 • 物理ベースの気候モデルとAIを組み合わせた新手法の提案 • 地域レベルの環境リスク評価の必要性 • ダイナミカル・ジェネレーティブ・ダウンスケーリング法の概要 • 確率的拡散モデルを用いたグローバルからローカルへの変換 • 従来の手法に比べてコストが大幅に削減される • 高解像度の気候予測を実現するための新しいアプローチ

Learning to clarify: Multi-turn conversations with Action-Based Contrastive Self-Training
本記事では、Action-Based Contrastive Self-Training(ACT)という手法を提案し、マルチターン会話モデリングにおけるデータ効率の良い強化学習調整アプローチを紹介しています。大規模言語モデル(LLM)は人間のフィードバックを通じて最適化されているものの、曖昧さに直面した際に明確化の質問を行う能力が不足していることが指摘されています。ACTは、直接的な好み最適化に基づく準オンラインの最適化アルゴリズムであり、データ効率の良い対話ポリシー学習を可能にします。実際の会話タスクを用いた実験により、ACTは従来の調整手法に比べて会話モデリングの改善を示しました。また、AmbigSQLという新しいタスクを導入し、複雑なSQLコード生成における情報の曖昧さを解消する能力を評価します。最終的に、ACTは会話エージェントが曖昧さを認識し、明確化の質問を行う能力を向上させることを目指しています。 • Action-Based Contrastive Self-Training (ACT)は、マルチターン会話モデリングのためのデータ効率の良い強化学習手法である。 • LLMは曖昧さに対して明確化の質問を行う能力が不足している。 • ACTは、直接的な好み最適化に基づく準オンラインの最適化アルゴリズムである。 • 実際の会話タスクを用いた実験で、ACTは従来の手法よりも会話モデリングの改善を示した。 • AmbigSQLという新しいタスクを導入し、SQLコード生成における情報の曖昧さを解消する能力を評価する。

Fine-tuning LLMs with user-level differential privacy
この記事では、ユーザーレベルの差分プライバシーを用いた大規模モデルのファインチューニングアルゴリズムの改善について探求しています。機械学習モデルは強力ですが、ドメイン特有のデータでファインチューニングする必要があり、プライバシーに敏感なデータが多いため、これが問題となります。差分プライバシー(DP)は、トレーニングプロセスにノイズを注入することで、プライバシーを保護しながらモデルを訓練する手法です。ユーザーレベルのDPは、個々の例のプライバシーを超え、ユーザーのデータがトレーニングデータセットに含まれているかどうかを攻撃者が知ることができないことを保証します。データセンターでのトレーニングは、フェデレーテッドラーニングよりも柔軟性が高く、ユーザー全体や個々の例を選択してクエリを実行できます。この記事では、ユーザーレベルのDPを大規模言語モデルにスケールアップする方法を探り、最適化アルゴリズムを特定し、トレーニング結果を向上させるための戦略を提案しています。 • ユーザーレベルの差分プライバシーを用いた大規模モデルのファインチューニングの必要性 • 差分プライバシーはプライバシーを保護しながらモデルを訓練する手法 • ユーザーレベルのDPは、個々のデータ例のプライバシーを超えた保護を提供する • データセンターでのトレーニングはフェデレーテッドラーニングよりも柔軟性が高い • ファインチューニングはプライベートなドメイン特有のデータを必要とする可能性が高い • トレーニング戦略はフェデレーテッドラーニングのアルゴリズムに似ている • SGDを用いたトレーニングにおいて、ノイズを加えることでプライバシーを保護する

Google Research at Google I/O 2025
2025年のGoogle I/Oで、Google Researchは最新の研究成果とGeminiモデル、生成AI製品への貢献を発表しました。特に、MedGemmaという新しい医療用AIモデルが紹介され、医療テキストと画像の理解を向上させることが期待されています。MedGemmaは、開発者が医療アプリケーションを構築するための出発点として設計されており、Google Cloud Platformやローカル環境で実行可能です。また、AMIEという医療診断会話用のAIエージェントも発表され、視覚的な医療情報を解釈し、診断の精度を向上させる手助けをします。さらに、LearnLMという学習用のモデル群がGemini 2.5に統合され、教育者にとって最適な選択肢となることが示されました。これにより、学生はカスタムクイズを作成し、学習をサポートする新しい体験が提供されます。 • Google I/O 2025での研究成果の発表 • MedGemmaは医療用のマルチモーダルAIモデルで、医療アプリケーションの開発を支援 • AMIEは医療診断会話用のAIエージェントで、診断精度を向上させる • LearnLMはGemini 2.5に統合され、教育者向けの最適なモデルとして機能 • 学生向けにカスタムクイズを作成する新しい体験を提供

Deeper insights into retrieval augmented generation: The role of sufficient context

Differential privacy on trust graphs

Bringing 3D shoppable products online with generative AI

A new light on neural connections

Making complex text understandable: Minimally-lossy text simplification with Gemini

Amplify Initiative: Localized data for globalized AI

AMIE gains vision: A research AI agent for multimodal diagnostic dialogue

Benchmarking LLMs for global health

Improving brain models with ZAPBench

Introducing Mobility AI: Advancing urban transportation

A new hybrid platform for quantum simulation of magnetism

InstructPipe: Generating Visual Blocks pipelines with human instructions and LLMs

Teaching machines the language of biology: Scaling large language models for next-generation single-cell analysis

Geospatial Reasoning: Unlocking insights with generative AI and multiple foundation models

Evaluating progress of LLMs on scientific problem-solving

ECLeKTic: A novel benchmark for evaluating cross-lingual knowledge transfer in LLMs

The evolution of graph learning

Deciphering language processing in the human brain through LLM representations

Load balancing with random job arrivals

Loss of Pulse Detection on the Google Pixel Watch 3
