Introducing ChatGPT Pulse

Introducing ChatGPT Pulse

Today we’re releasing a preview of ChatGPT Pulse to Pro users—a new experience where ChatGPT proactively does research to deliver personalized updates based on your chats, feedback, and connected apps. Each night ChatGPT learns what matters to you—pulling from memory, chats, and feedback—then delivers focused updates the next day. Expand updates to dive deeper, grab next steps, or save for later so you stay on track with clear, timely info. Pulse is the first step toward a more useful ChatGPT that proactively works on your behalf, and this preview lets us work with power users to learn, iterate, and improve before rolling it out more broadly.

YouTube OpenAI
Gemini Robotics 1.5 brings AI agents into the physical world

Gemini Robotics 1.5 brings AI agents into the physical world

We’re powering an era of physical agents — enabling robots to perceive, plan, think, use tools and act to better solve complex multi-step tasks.

DeepMind Blog
api cloud tool
Release v3.28.8

Release v3.28.8

RooCodeIncのGitHubリポジトリでリリースされたバージョン3.28.8では、いくつかの重要な修正と機能追加が行われた。主な修正点としては、頻繁に発生していた「No tool used」エラーの解決があり、ツール使用ルールの明確化が行われた。また、要約機能に初期の質問を含める修正も行われた。新たにRooプロバイダーでの無料モデルのサポートが追加され、ログイン時にクラウドスイッチャーとチーム追加オプションが表示されるようになった。さらに、ウェブ用のOpengraph画像も追加された。 • 頻繁に発生していた「No tool used」エラーを修正 • 要約機能に初期の質問を含める修正 • Rooプロバイダーでの無料モデルのサポートを追加 • ログイン時にクラウドスイッチャーとチーム追加オプションを表示 • ウェブ用のOpengraph画像を追加

RooCodeInc/Roo-Code
release tool
0.57.2 - 2025-09-25

0.57.2 - 2025-09-25

この記事は、GitHub上のAll-Hands-AI/OpenHandsリポジトリのバージョン0.57.2のリリースノートについて説明しています。このリリースは2025年9月25日に行われ、主に依存関係の問題を解決するためにlitellmのバージョンを固定しました。また、Claude Sonnetの出力トークン制限も設定されました。これにより、ユーザーはより安定した動作を期待できるようになります。 • 依存関係の問題を解決するためにlitellmのバージョンを固定した • Claude Sonnetの出力トークン制限を設定した • リリースは2025年9月25日に行われた • 51のコミットがメインブランチに追加された

All-Hands-AI/OpenHands
release tool
Measuring the performance of our models on real-world tasks

Measuring the performance of our models on real-world tasks

We’re introducing GDPval, a new evaluation that measures model performance on economically valuable, real-world tasks across 44 occupations.

OpenAI Blog
tool
No Image

Don't hide your best documentation

If you hide the system prompt and tool descriptions for your LLM agent, what you're actually doing is deliberately hiding the most useful documentation describing your service from your most …

Simon Willison's Blog
platform
Introducing ChatGPT Pulse

Introducing ChatGPT Pulse

Today we're releasing a preview of ChatGPT Pulse to Pro users on mobile. Pulse is a new experience where ChatGPT proactively does research to deliver personalized updates based on your chats, feedback, and connected apps like your calendar.

OpenAI Blog
tool
No Image

Quoting Stanford CS221 Autumn 2025

[2 points] Learn basic NumPy operations with an AI tutor! Use an AI chatbot (e.g., ChatGPT, Claude, Gemini, or Stanford AI Playground) to teach yourself how to do basic vector …

Simon Willison's Blog
tool
No Image

Cross-Agent Privilege Escalation: When Agents Free Each Other

Here's a clever new form of AI exploit from Johann Rehberger, who has coined the term Cross-Agent Privilege Escalation to describe an attack where multiple coding agents - GitHub Copilot …

Simon Willison's Blog
security
langchain==1.0.0a9

langchain==1.0.0a9

この記事は、LangChainのバージョン1.0.0a9のリリースに関する情報を提供しています。このリリースでは、Anthropicのキャッシングに関する修正や、動的に生成されたミドルウェアのための新しいデコレーターパターンの導入が含まれています。また、HITL(Human-in-the-Loop)に関連するバグ修正や、ツールノードのエラーハンドラーにPEP604のサポートが追加されました。さらに、Python 3.9のサポートが削除され、最新のコアバージョンが使用されています。全体として、LangChainの機能向上と安定性の向上を目指した更新が行われています。 • LangChainのバージョン1.0.0a9がリリースされた。 • Anthropicのキャッシングに関する修正が行われた。 • 動的に生成されたミドルウェアのための新しいデコレーターパターンが導入された。 • HITLに関連するバグが修正された。 • Python 3.9のサポートが削除され、最新のコアバージョンが使用されている。

langchain-ai/langchain
release tool
langchain==1.0.0a8

langchain==1.0.0a8

この記事は、LangChainのバージョン1.0.0a8のリリースに関するもので、主に新機能や修正点について説明しています。新たに導入された機能には、Anthropicプロンプトキャッシングの改善や、動的に生成されるミドルウェアのための新しいデコレーターパターンが含まれています。また、HITL(Human In The Loop)に関連するバグ修正や、ツールの登録に必要な全ての状態を注入するための修正も行われています。さらに、PEP604のサポートや、エラーハンドラーにおけるツールノードの改善も報告されています。全体として、LangChainの機能向上と安定性の向上を目指した更新が行われています。 • LangChainのバージョン1.0.0a8がリリースされた。 • Anthropicプロンプトキャッシングの改善が行われた。 • 動的に生成されるミドルウェアのための新しいデコレーターパターンが追加された。 • HITLに関連するバグ修正が行われ、ツールの登録に必要な全ての状態を注入する修正が施された。 • PEP604のサポートが追加され、エラーハンドラーの改善が行われた。

langchain-ai/langchain
release tool
AfriMed-QA: Benchmarking large language models for global health

AfriMed-QA: Benchmarking large language models for global health

AfriMed-QAは、アフリカの健康に関する質問応答タスクのために開発された大規模なベンチマークデータセットであり、アフリカ各国の組織と協力して作成されました。このデータセットは、医療関連の質問に対する大規模言語モデル(LLM)の評価に使用され、約15,000の臨床的に多様な質問と回答、4,000以上の専門的な選択問題、1,200以上のオープンエンドの短答問題、10,000の消費者からの質問を含んでいます。LLMは、これらのデータセットに対する応答を人間の専門家の回答と比較し、評価されました。AfriMed-QAは、アフリカの医療における公平で効果的なLLMの開発を目指しており、地域特有の医療知識を反映した多様なベンチマークデータセットの必要性を強調しています。 • アフリカの健康に関する質問応答タスクのためのベンチマークデータセット • 約15,000の臨床的に多様な質問と回答を含む • 4,000以上の専門的な選択問題と1,200以上のオープンエンドの短答問題を収録 • 地域特有の医療知識を反映したデータセットの必要性 • LLMの応答を人間の専門家の回答と比較して評価 • データセットはオープンソースでコミュニティに提供されている

Google Research
api cloud tool
No Image

Transforming the manufacturing industry with ChatGPT

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコードの意図を理解し、適切なコードスニペットを提案する機能があります。また、ユーザーインターフェースは直感的で使いやすく、学習曲線が緩やかであることが強調されています。さらに、このツールは既存の開発環境に簡単に統合できるため、導入のハードルが低い点もメリットとして挙げられています。 • AI技術を活用した新しい開発ツールの紹介 • コードの自動生成や補完機能を提供 • 開発者の意図を理解し、適切なコードスニペットを提案 • 直感的で使いやすいユーザーインターフェース • 既存の開発環境に簡単に統合可能

OpenAI Blog
tool
Celebrating the 2025–2026 MIE Experts and Showcase Schools

Celebrating the 2025–2026 MIE Experts and Showcase Schools

Join us as we welcome Microsoft Showcase Schools and MIE Experts 2025-2026. Discover how to become an MIEE or Microsoft Showcase School.

Microsoft AI Blog
platform tool
Google AI Pro and Ultra subscribers now get Gemini CLI and Gemini Code Assist with higher limits.

Google AI Pro and Ultra subscribers now get Gemini CLI and Gemini Code Assist with higher limits.

Google AI Pro and Ultra subscribers now get higher limits to Gemini CLI and Gemini Code Assist IDE extensions.

Google AI Blog
api tool
Expanding model choice in Microsoft 365 Copilot

Expanding model choice in Microsoft 365 Copilot

We’re excited to announce that we’re expanding the models that power Microsoft 365 Copilot with the addition of Anthropic models.

Microsoft AI Blog
tool
Agent Factory: Designing the open agentic web stack

Agent Factory: Designing the open agentic web stack

Find out how the agentic web stack—a cohesive, interoperable ecosystem—can help you fully harness the potential of AI agents.

Microsoft AI Blog
api cloud tool
We’re making public data more usable for AI developers with the Data Commons MCP Server

We’re making public data more usable for AI developers with the Data Commons MCP Server

Today marks the launch of the Data Commons Model Context Protocol (MCP) Server, which allows developers to query our connected public data with simple, natural language.…

Google AI Blog
api cloud tool
6 easy ways to level up Claude Code

6 easy ways to level up Claude Code

Walk through six tips and tricks that help you level up Claude Code to move beyond simply entering prompts into a text box.

logrocket-dev
api tool
Meet 25 startups using AI to improve public services

Meet 25 startups using AI to improve public services

Google announces its first cohort of 25 startups using AI to improve public services.

Google AI Blog
platform tool
SAP and OpenAI partner to launch sovereign ‘OpenAI for Germany’

SAP and OpenAI partner to launch sovereign ‘OpenAI for Germany’

SAP and OpenAI launch OpenAI for Germany, a 2026 partnership to bring secure, sovereign AI to Germany’s public sector, enabling safe, efficient public services.

OpenAI Blog
tool
How Replit’s Agent 3 builds Mastra Agents for you

How Replit’s Agent 3 builds Mastra Agents for you

Replit’s Agent 3 can automatically generate Mastra agents and workflows from natural language descriptions.

Mastra Blog
ai api cloud
GPT-5-Codex

GPT-5-Codex

OpenAI half-relased this model earlier this month, adding it to their Codex CLI tool but not their API. Today they've fixed that - the new model can now be accessed …

Simon Willison's Blog
api library tool
No Image

Qwen3-VL: Sharper Vision, Deeper Thought, Broader Action

I've been looking forward to this. Qwen 2.5 VL is one of the best available open weight vision LLMs, so I had high hopes for Qwen 3's vision models. Firstly, …

Simon Willison's Blog
platform
Release v3.28.7

Release v3.28.7

RooCodeIncのGitHubリポジトリで公開されたリリースv3.28.7では、ユーザーエクスペリエンスの向上を目的としたいくつかの変更が行われた。デフォルトで思考ブロックを折りたたむ設定が追加され、チェックポイント復元ポップオーバーの位置に関する問題が修正された。また、クラウドアカウントスイッチャー機能が追加され、Chutesプロバイダーにおいてzai-org/GLM-4.5-turboモデルのサポートが追加された。これらの変更は、ユーザーの利便性を高めることを目的としている。 • ユーザーエクスペリエンスの向上を目的とした変更が行われた • 思考ブロックをデフォルトで折りたたむ設定が追加された • チェックポイント復元ポップオーバーの位置に関する問題が修正された • クラウドアカウントスイッチャー機能が追加された • Chutesプロバイダーにzai-org/GLM-4.5-turboモデルのサポートが追加された

RooCodeInc/Roo-Code
release tool
2025-09-23

2025-09-23

この記事は、mastra-aiのリリースノート2025年9月23日版について説明しています。主な更新内容には、エージェントのタイプ処理に関するバグ修正、エージェント出力オプションの型システムの改善、プロジェクトルートのプライベートパッケージサポート、モデルの更新と再配置を行う新しいAPIの追加、ユーザーインターフェースの改善、スコアリング機能の強化、メモリ管理のパフォーマンス向上、ストレージのスキーマ互換性に関する変更が含まれています。特に、エージェントの指示がより柔軟で構造化された形式をサポートするようになり、開発者ツールのコードベースが改善され、ツール呼び出しの一時停止と再開機能が追加されました。 • エージェントのタイプ処理に関するバグ修正が行われた。 • エージェント出力オプションの型システムが改善され、型推論と安全性が向上した。 • プロジェクトルートでプライベートパッケージをサポートするための設定が追加された。 • 新しいAPIが追加され、モデルの更新と再配置が可能になった。 • ユーザーインターフェースが改善され、エージェントメタデータモデルスイッチャーに自動保存機能が追加された。 • スコアリング機能が強化され、トレースのスコアリングが可能になった。 • メモリ管理のパフォーマンスが向上し、チャットの中断が防止された。 • ストレージのスキーマ互換性に関する変更が行われた。

mastra-ai/mastra
release tool
Running deep research AI agents on Amazon Bedrock AgentCore

Running deep research AI agents on Amazon Bedrock AgentCore

AI agents are evolving beyond basic single-task helpers into more powerful systems that can plan, critique, and collaborate with other agents to solve complex problems. Deep Agents—a recently introduced framework built on LangGraph—bring these capabilities to life, enabling multi-agent workflows that mirror real-world team dynamics. The challenge, however, is not just building such agents but […]

AWS Machine Learning Blog
api cloud tool
Mixboard is a new way to visualize your ideas from Google Labs.

Mixboard is a new way to visualize your ideas from Google Labs.

Mixboard is an experimental, AI-powered visual brainstorming tool that helps you explore, expand and refine ideas.

Google AI Blog
tool
Google AI Plus — our newest AI plan — is now available in 40 more countries.

Google AI Plus — our newest AI plan — is now available in 40 more countries.

Google AI Plus — our newest AI plan — is now available in more than 40 more countries.

Google AI Blog
api cloud tool
Release v3.28.6

Release v3.28.6

RooCodeIncのGitHubリポジトリで公開されたリリースv3.28.6では、いくつかの新機能と修正が行われた。新たにGPT-5-Codexモデルが追加され、キーボードショートカットで自動承認を切り替える機能も実装された。また、推論ブロックのフォーマットが改善され、非英語言語でのチェックポイントテキストの折り返しを防ぐ修正も行われた。さらに、CodeBlockから言語選択とワードラップのトグルが削除され、翻訳の欠落を見つけるスクリプトにpackage.nls.jsonのチェックが追加された。これらの変更により、ユーザーの利便性が向上し、より良い操作体験が提供される。 • 新機能としてGPT-5-Codexモデルが追加された • 自動承認を切り替えるためのキーボードショートカットが実装された • 推論ブロックのフォーマットが改善され、可読性が向上した • 非英語言語でのチェックポイントテキストの折り返しを防ぐ修正が行われた • CodeBlockから言語選択とワードラップのトグルが削除された • 翻訳の欠落を見つけるスクリプトにpackage.nls.jsonのチェックが追加された

RooCodeInc/Roo-Code
release tool
Time series foundation models can be few-shot learners

Time series foundation models can be few-shot learners

本記事では、時系列予測のための新しいアプローチを提案しています。このアプローチは、時系列ファウンデーションモデルを継続的に再訓練し、推論時にコンテキストの例から学習できるようにするものです。従来の方法では、各タスクに特化したモデルを構築する必要がありましたが、提案されたモデル「TimesFM」は、ゼロショット学習を用いてタスク特化の訓練なしで正確な予測を行うことができます。新たに導入された「In-Context Fine-Tuning」では、少数の例から学習する能力を持つモデルに変革され、ユーザーによる追加の複雑な訓練なしで、監視付きファインチューニングと同等の性能を発揮します。モデルは、異なるデータセットを混同しないように、学習可能な「共通セパレータトークン」を使用して、過去の例からのパターンを学び、現在の予測に応用します。 • 時系列予測の重要性と従来のモデル構築の課題を解決するアプローチを提案 • 新しいモデル「TimesFM」はゼロショット学習を用いており、タスク特化の訓練なしで予測が可能 • 「In-Context Fine-Tuning」により、少数の例から学習する能力を持つモデルに進化 • ユーザーによる追加の訓練なしで、監視付きファインチューニングと同等の性能を実現 • モデルは、異なるデータセットを混同しないために「共通セパレータトークン」を使用している

Google Research
api tool
Try AI Mode in Spanish today.

Try AI Mode in Spanish today.

AI Mode in Google Search is starting to roll out globally in Spanish today.

Google AI Blog
api cloud
Integrate tokenization with Amazon Bedrock Guardrails for secure data handling

Integrate tokenization with Amazon Bedrock Guardrails for secure data handling

In this post, we show you how to integrate Amazon Bedrock Guardrails with third-party tokenization services to protect sensitive data while maintaining data reversibility. By combining these technologies, organizations can implement stronger privacy controls while preserving the functionality of their generative AI applications and related systems.

AWS Machine Learning Blog
api cloud security
Android users can now use conversational editing in Google Photos.

Android users can now use conversational editing in Google Photos.

We’re expanding the ability to edit your images by simply asking in Google Photos to Android devices.

Google AI Blog
tool
AI chips are getting hotter. A microfluidics breakthrough goes straight to the silicon to cool up to three times better.

AI chips are getting hotter. A microfluidics breakthrough goes straight to the silicon to cool up to three times better.

AIチップは熱を発生しやすく、従来の冷却技術では限界がある中、マイクロ流体技術を用いた新しい冷却システムが開発され、従来の冷却プレートよりも最大3倍の効率で熱を除去できることが示された。この技術は、シリコンチップの裏面に微細なチャンネルを刻むことで冷却液を直接流し込み、熱を効率的に取り除く。AIを活用してチップ上の熱の特性を特定し、冷却液を精密に制御することも可能になった。マイクロ流体技術は、次世代AIチップの効率性と持続可能性を向上させると期待されている。実験では、冷却プレートと比較して最大65%の温度上昇の抑制が確認され、データセンターのエネルギー効率や運用コストの削減にも寄与する可能性がある。 • AIチップは従来のシリコンよりも多くの熱を発生させるため、冷却技術の限界が懸念されている。 • マイクロ流体技術を用いた新しい冷却システムは、従来の冷却プレートよりも最大3倍の熱除去効率を持つ。 • 冷却液をシリコンチップの裏面に直接流し込むことで、熱を効率的に取り除くことができる。 • AIを活用してチップ上の熱の特性を特定し、冷却液の流れを精密に制御する。 • マイクロ流体技術は次世代AIチップの効率性と持続可能性を向上させる可能性がある。 • 実験では、冷却プレートと比較して最大65%の温度上昇の抑制が確認された。 • この技術はデータセンターのエネルギー効率や運用コストの削減にも寄与する。

Microsoft AI Blog
api tool
OpenAI, Oracle, and SoftBank expand Stargate with five new AI datacenter sites

OpenAI, Oracle, and SoftBank expand Stargate with five new AI datacenter sites

New data centers put Stargate ahead of schedule to secure full $500 billion, 10-gigawatt commitment by end of 2025.

OpenAI Blog
tool
Accelerate migration and modernization with agentic AI

Accelerate migration and modernization with agentic AI

At the Migrate and Modernize Summit, we’re announcing a set of agentic AI solutions and offerings to speed transformation and reduce friction. Learn more.

Microsoft AI Blog
platform
Chrome DevTools (MCP) for your AI agent

Chrome DevTools (MCP) for your AI agent

Public preview for the new Chrome DevTools MCP server, bringing the power of Chrome DevTools to AI coding assistants.

chrome-developer-blog
api tool
Sentry AI code review, now in beta: break production less

Sentry AI code review, now in beta: break production less

Sentry AI code review helps you ship code that breaks production less. Predict errors, get code reviews, and generate tests with Sentry's unique context.

sentry-blog
api tool
YAML ファイルで AI エージェントを構築する cagent

YAML ファイルで AI エージェントを構築する cagent

cagent は Docker 社が開発した AI エージェントフレームワークです。YAML ファイルでエージェントの振る舞い・役割・使用するツールを宣言的に定義でき、コードを 1 行も書かずにエージェントを構築できます。この記事では cagent の概要とインストール方法、YAML ファイルの書き方、実際にエージェントを動作させるまでの手順を解説します。

azukiazusa のテックブログ2
api tool
No Image

Why AI systems might never be secure

The Economist have a new piece out about LLM security, with this headline and subtitle: Why AI systems might never be secure A “lethal trifecta” of conditions opens them to …

Simon Willison's Blog
security
langchain==1.0.0a7

langchain==1.0.0a7

この記事は、LangChainのバージョン1.0.0a7のリリースに関する情報を提供しています。このリリースでは、HITLバグの修正や、動的システムプロンプトミドルウェアの追加、PEP604のサポートなどが含まれています。また、mypyのバージョンを1.18に更新し、いくつかのドキュメントの更新やコードのクリーンアップも行われました。さらに、エージェント作成機能の改善や、エラーハンドラーの強化も行われています。これにより、LangChainの機能が向上し、開発者にとって使いやすくなっています。 • HITLバグの修正により、重複中断の問題が解決された。 • 動的システムプロンプトミドルウェアが追加された。 • PEP604(| union)のサポートが強化された。 • mypyのバージョンが1.18に更新された。 • エージェント作成機能が改善され、エラーハンドラーが強化された。

langchain-ai/langchain
release tool
No Image

Quoting Kate Niederhoffer, Gabriella Rosen Kellerman, Angela Lee, Alex Liebscher, Kristina Rapuano and Jeffrey T. Hancock

We define workslop as AI generated work content that masquerades as good work, but lacks the substance to meaningfully advance a given task. Here’s how this happens. As AI tools …

Simon Willison's Blog
tool
Four new releases from Qwen

Four new releases from Qwen

It's been an extremely busy day for team Qwen. Within the last 24 hours (all links to Twitter, which seems to be their preferred platform for these announcements): Qwen3-Next-80B-A3B-Instruct-FP8 and …

Simon Willison's Blog
library tool
CompileBench: Can AI Compile 22-year-old Code?

CompileBench: Can AI Compile 22-year-old Code?

Interesting new LLM benchmark from Piotr Grabowski and Piotr Migdał: how well can different models handle compilation challenges such as cross-compiling gucr for ARM64 architecture? This is one of my …

Simon Willison's Blog
api tool
CNA is transforming its newsroom with AI

CNA is transforming its newsroom with AI

A conversation with Walter Fernandez, Editor-in-Chief of CNA.

OpenAI Blog
tool
Rapid ML experimentation for enterprises with Amazon SageMaker AI and Comet

Rapid ML experimentation for enterprises with Amazon SageMaker AI and Comet

In this post, we showed how to use SageMaker and Comet together to spin up fully managed ML environments with reproducibility and experiment tracking capabilities.

AWS Machine Learning Blog
api tool
No Image

ChatGPT Is Blowing Up Marriages as Spouses Use AI to Attack Their Partners

Maggie Harrison Dupré for Futurism. It turns out having an always-available "marriage therapist" with a sycophantic instinct to always take your side is catastrophic for relationships. The tension in the …

Simon Willison's Blog
platform
Strengthening our Frontier Safety Framework

Strengthening our Frontier Safety Framework

Today, we’re publishing the third iteration of our Frontier Safety Framework (FSF) — our most comprehensive approach yet to identifying and mitigating severe risks from advanced AI models. This...

DeepMind Blog
api tool
No Image

American-made innovation

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
Creating a safe, observable AI infrastructure for 1 million classrooms

Creating a safe, observable AI infrastructure for 1 million classrooms

With GPT-4.1, image generation, and text-to-speech, SchoolAI creates safe, observable AI infrastructure for 1 million classrooms—and growing.

OpenAI Blog
tool
No Image

OpenAI and NVIDIA announce strategic partnership to deploy 10 gigawatts of NVIDIA systems

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
Built-in AI is now available on Chromebook Plus devices

Built-in AI is now available on Chromebook Plus devices

Chrome's Built-in AI APIs are now available on Chromebook Plus devices, enabling web developers to bring client-side AI features to more users.

chrome-developer-blog
api security tool
Enabling Deterministic Inference for SGLang

Enabling Deterministic Inference for SGLang

<p>This post highlights our initial efforts to achieve deterministic inference in SGLang. By integrating batch invariant kernels released by Thinking Machine...

LMSYS Blog
api tool
Inside Sentry’s Hackweek: An excuse to break things

Inside Sentry’s Hackweek: An excuse to break things

During Sentry's Hackweek, we unleashed Gremlins: AI agents that break real apps on purpose, and used Sentry to capture errors, replays, and traces.

sentry-blog
api tool
Gaia2 and ARE: Empowering the community to study agents

Gaia2 and ARE: Empowering the community to study agents

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api tool
No Image

Locally AI

Handy new iOS app by Adrien Grondin for running local LLMs on your phone. It just added support for the new iOS 26 Apple Foundation model, so you can install …

Simon Willison's Blog
mobile
🥇Top AI Papers of the Week

🥇Top AI Papers of the Week

The Top AI Papers of the Week (September 15-21)

Elvis Saravia's NLP Blog
platform
GPT‑5 Codexがリリース

GPT‑5 Codexがリリース

OpenAIが2025年9月15日にGPT‑5 Codexを発表しました。GPT‑5 CodexはGPT‑5を土台にして、エージェントのコーディング能力に適した学習と強化が加えられたモデルです。長時間の自律的な作業に特に強みがあります。 We’re releasing new Codex features to make it a more effective coding collaborator: - A new IDE extension - Easily move tasks between the cloud and your local environment - Code reviews in GitHub - Revamped Codex CLI Powered by

Lai.so Blog
api tool
No Image

llm-openrouter 0.5

New release of my LLM plugin for accessing models made available via OpenRouter. The release notes in full: Support for tool calling. Thanks, James Sanford. #43 Support for reasoning options, …

Simon Willison's Blog
api tool
Optimizing FP4 Mixed-Precision Inference on AMD GPUs

Optimizing FP4 Mixed-Precision Inference on AMD GPUs

<p>Haohui Mai (CausalFlow.ai), Lei Zhang (AMD)</p> <h2><a id="introduction" class="anchor" href="#introduction" aria-hidden="true"><svg aria-hidden="true" cl...

LMSYS Blog
library tool
Grok 4 Fast

Grok 4 Fast

New hosted vision-enabled reasoning model from xAI that's designed to be fast and extremely competitive on price. It has a 2 million token context window and "was trained end-to-end with …

Simon Willison's Blog
tool
Release v3.28.5

Release v3.28.5

RooCodeIncのRoo-Codeリポジトリで、バージョン3.28.5がリリースされました。このリリースは2023年9月20日に行われ、GitHub上で公開されています。リリースノートには、特定の変更点や新機能についての詳細は記載されていませんが、リリースのアセットが3つ用意されています。ユーザーは、GitHubのインターフェースを通じてこのリリースにアクセスし、必要に応じてダウンロードすることができます。 • Roo-Codeのバージョン3.28.5が2023年9月20日にリリースされた。 • リリースノートには具体的な変更点や新機能の詳細は記載されていない。 • リリースには3つのアセットが含まれている。 • ユーザーはGitHubを通じてリリースにアクセス可能。

RooCodeInc/Roo-Code
release tool
sdk==0.2.9

sdk==0.2.9

この記事は、GitHub上で公開されているlangchain-aiのlanggraphリポジトリにおけるsdkのバージョン0.2.9のリリースについて説明しています。このリリースは2023年9月20日に行われ、主な変更点として、sdk-pyがwait/join/cancelエンドポイントでの長期応答への再接続機能を追加したことが挙げられています。これにより、ユーザーは長時間の応答を待つ際に、接続が切れた場合でも再接続が可能となり、より安定した操作が実現されます。 • リリース日: 2023年9月20日 • バージョン: sdk==0.2.9 • 主な変更: wait/join/cancelエンドポイントでの長期応答への再接続機能の追加 • ユーザーにとっての利点: 接続が切れた場合でも再接続が可能になり、安定した操作が実現される

langchain-ai/langgraph
release tool
🤖 AI Agents Weekly: GPT-5-Codex, Grok 4 Fast, Tongyi DeepResearch, Magistral Small 1.2, Agent Payments Protocol (AP2)

🤖 AI Agents Weekly: GPT-5-Codex, Grok 4 Fast, Tongyi DeepResearch, Magistral Small 1.2, Agent Payments Protocol (AP2)

GPT-5-Codex, Grok 4 Fast, Tongyi DeepResearch, Magistral Small 1.2, Agent Payments Protocol (AP2)

Elvis Saravia's NLP Blog
api tool
AI エージェントのための Agent Payments Protocol (AP2) を試してみた

AI エージェントのための Agent Payments Protocol (AP2) を試してみた

現状の決済システムでは人間が信頼できる画面上で直接購入ボタンをクリックすることを前提としており、自立型の AI エージェントがユーザーに代わって決済することは想定されていません。そこで Google により Agent Payments Protocol (AP2) と呼ばれる新しいプロトコルが提案されました。プラットフォーム間でエージェント主導の決済を安全に開始・処理することを可能にします。この記事では AP2 のサンプルコードを実際に試してみた手順を紹介します。

azukiazusa のテックブログ2
api security tool
Release v3.28.4

Release v3.28.4

RooCodeIncのGitHubリポジトリで公開されたリリースv3.28.4では、ユーザーエクスペリエンスの向上が図られた。具体的には、メッセージフィードのデザインが再構築され、レスポンシブな自動承認機能が追加された。また、ネットワークの耐障害性を高めるためのテレメトリ再試行キューが導入され、コマンド+yショートカットを修正するためにナイトリービルドでのキー割り当ての変換が行われた。さらに、Roo Code Cloudプロバイダーに新しいコードスーパーノバステルスモデルが追加された。 • ユーザーエクスペリエンスの向上 • メッセージフィードのデザイン再構築 • レスポンシブな自動承認機能の追加 • ネットワーク耐障害性向上のためのテレメトリ再試行キューの導入 • コマンド+yショートカットの修正 • 新しいコードスーパーノバステルスモデルの追加

RooCodeInc/Roo-Code
release tool
Deep researcher with test-time diffusion

Deep researcher with test-time diffusion

本記事では、Test-Time Diffusion Deep Researcher(TTD-DR)というフレームワークを紹介しています。TTD-DRは、Deep Researchエージェントを用いて、高品質な情報を取得しながら自身の草稿を作成・修正する手法です。このアプローチにより、長文の研究報告書作成や複雑な推論タスクにおいて新たな最先端の成果を達成しました。TTD-DRは、研究報告書の執筆を拡散プロセスとしてモデル化し、初期の雑な草稿を高品質な最終版に徐々に洗練させることを目指しています。具体的には、自己進化によるコンポーネントごとの最適化と、情報取得を用いたデノイジングによる報告書レベルの改良を行います。これにより、TTD-DRは報告書作成プロセスをより一貫性のあるものにし、各サイクルで報告書を改善することが可能です。 • TTD-DRは、Deep Researchエージェントを用いて草稿を作成・修正するフレームワークである。 • このアプローチは、長文の研究報告書作成や複雑な推論タスクで新たな最先端の成果を達成した。 • TTD-DRは、研究報告書の執筆を拡散プロセスとしてモデル化している。 • 自己進化によるコンポーネントごとの最適化と、情報取得を用いたデノイジングによる報告書レベルの改良を行う。 • このプロセスにより、報告書作成がより一貫性のあるものとなり、各サイクルで改善される。

Google Research
api tool
v0.17.6 Patch Release

v0.17.6 Patch Release

DeepSpeedのv0.17.6パッチリリースでは、いくつかの重要な更新が行われました。主な変更点には、DeepSpeedのオフロードとリロード状態のサポート、Muonオプティマイザーの有効化、非ZeROモードの有効化、riscv64 CPUサポートの追加、エラーメッセージの改善、autocastテストの検証の簡素化などが含まれています。また、いくつかのバグ修正も行われ、特にDeepCompile Z1/2の勾配バッファアクセスの修正や、MoEの専門家並列グループサイズの誤用の修正が挙げられます。新しいコントリビューターも数名参加しており、コミュニティの活性化が見られます。 • DeepSpeedのオフロードとリロード状態のサポートが追加された。 • Muonオプティマイザーが有効化された。 • 非ZeROモードが有効化された。 • riscv64 CPUサポートが追加された。 • エラーメッセージの改善とautocastテストの検証の簡素化が行われた。 • DeepCompile Z1/2の勾配バッファアクセスのバグが修正された。 • MoEの専門家並列グループサイズの誤用が修正された。 • 新しいコントリビューターが参加した。

microsoft/DeepSpeed
library release tool
No Image

TorchAO Quantized Models and Quantization Recipes Now Available on HuggingFace Hub

PyTorchは、TorchAOチームとUnslothの協力により、Phi4-mini-instruct、Qwen3、SmolLM3-3B、gemma-3-270m-itのネイティブ量子化バリアントを提供しています。これらのモデルは、int4およびfloat8の量子化を活用し、A100、H100、モバイルデバイスで効率的な推論を実現し、bfloat16モデルと比較してモデル品質の劣化を最小限に抑えています。リリースされたモデルは、サーバーおよびモバイルプラットフォーム向けに最適化されており、ユーザーは生産環境での高速モデルの展開が可能です。また、PyTorchのネイティブ量子化を自分のモデルやデータセットに適用するための包括的で再現可能な量子化レシピとガイドも提供されています。これにより、ユーザーはモデルの品質評価やパフォーマンスベンチマークを行うことができます。 • PyTorchが提供する量子化モデルは、Phi4-mini-instruct、Qwen3、SmolLM3-3B、gemma-3-270m-itである。 • int4およびfloat8の量子化を使用し、A100、H100、モバイルデバイスで効率的な推論を実現。 • リリースされたモデルは、サーバーおよびモバイルプラットフォーム向けに最適化されている。 • PyTorchのネイティブ量子化を適用するための再現可能な量子化レシピとガイドが提供されている。 • 量子化により、モデルの速度が最大2倍向上し、メモリ使用量が30-60%削減される。

PyTorch Blog
library tool
No Image

Magistral 1.2

Mistral quietly released two new models yesterday: Magistral Small 1.2 (Apache 2.0, 96.1 GB on Hugging Face) and Magistral Medium 1.2 (not open weights same as Mistral's other "medium" models.) …

Simon Willison's Blog
platform
No Image

The Hidden Risk in Notion 3.0 AI Agents: Web Search Tool Abuse for Data Exfiltration

Abi Raghuram reports that Notion 3.0, released yesterday, introduces new prompt injection data exfiltration vulnerabilities thanks to enabling lethal trifecta attacks. Abi's attack involves a PDF with hidden text (white …

Simon Willison's Blog
security
langchain==1.0.0a6

langchain==1.0.0a6

この記事は、LangChainのバージョン1.0.0a6のリリースに関するもので、主に新機能や修正点について説明しています。新たに導入された機能には、動的システムプロンプトミドルウェアや、HITLパターンの改善が含まれています。また、ツールノードのエラーハンドラーにPEP604のサポートが追加され、エージェント作成時のミドルウェアサポートも強化されています。さらに、mypyのバージョンが更新され、ドキュメントの改善やコードのフォーマットに関する変更も行われています。これらの変更は、LangChainの機能性と使いやすさを向上させることを目的としています。 • LangChainのバージョン1.0.0a6がリリースされた。 • 動的システムプロンプトミドルウェアが新たに追加された。 • HITLパターンの改善が行われた。 • ツールノードのエラーハンドラーにPEP604のサポートが追加された。 • エージェント作成時のミドルウェアサポートが強化された。 • mypyのバージョンが更新された。 • ドキュメントの改善やコードフォーマットに関する変更が行われた。

langchain-ai/langchain
release tool
0.57.0 - 2025-09-19

0.57.0 - 2025-09-19

この記事は、OpenHandsのバージョン0.57.0のリリースに関するもので、2025年9月19日に公開されました。このリリースでは、ランディングページと会話ページの新しいUIが追加され、OpenHands Cloudにおいて「自分のキーを持ち込む(BYOK)」機能が導入されました。また、いくつかの新しい貢献者がこのリリースに参加しており、彼らの初めての貢献が記載されています。 • 新しいUIがランディングページと会話ページに追加された • OpenHands CloudにBYOK機能が導入された • 新しい貢献者が5名参加し、初めての貢献を行った • リリース日は2025年9月19日である • バージョン0.56.0から0.57.0までの変更点が含まれている

All-Hands-AI/OpenHands
release tool
Move your AI agents from proof of concept to production with Amazon Bedrock AgentCore

Move your AI agents from proof of concept to production with Amazon Bedrock AgentCore

This post explores how Amazon Bedrock AgentCore helps you transition your agentic applications from experimental proof of concept to production-ready systems. We follow the journey of a customer support agent that evolves from a simple local prototype to a comprehensive, enterprise-grade solution capable of handling multiple concurrent users while maintaining security and performance standards.

AWS Machine Learning Blog
api tool
3 ways to use photo-to-video in Gemini

3 ways to use photo-to-video in Gemini

Here’s how I’ve been using Gemini’s photo-to-video tool as a multimedia storyteller, plus some tips for making your own videos.

Google AI Blog
tool
Environment-aware model routing: Build smarter AI apps with AI SDK

Environment-aware model routing: Build smarter AI apps with AI SDK

Discover a handy pattern for routing LLM calls in an “environment-aware” manner, using AI SDK’s middleware.

logrocket-dev
api tool
How the U.S. Patent and Trademark Office can help America maintain its AI leadership

How the U.S. Patent and Trademark Office can help America maintain its AI leadership

As the new Director of the USPTO begins his term, Google’s sharing policy recommendations to help America maintain its AI Leadership.

Google AI Blog
api cloud tool
Scaleway on Hugging Face Inference Providers 🔥

Scaleway on Hugging Face Inference Providers 🔥

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api cloud tool
No Image

Quoting Steve Jobs

Well, the types of computers we have today are tools. They’re responders: you ask a computer to do something and it will do it. The next stage is going to …

Simon Willison's Blog
tool
Scale visual production using Stability AI Image Services in Amazon Bedrock

Scale visual production using Stability AI Image Services in Amazon Bedrock

This post was written with Alex Gnibus of Stability AI. Stability AI Image Services are now available in Amazon Bedrock, offering ready-to-use media editing capabilities delivered through the Amazon Bedrock API. These image editing tools expand on the capabilities of Stability AI’s Stable Diffusion 3.5 models (SD3.5) and Stable Image Core and Ultra models, which […]

AWS Machine Learning Blog
api tool
Prompting for precision with Stability AI Image Services in Amazon Bedrock

Prompting for precision with Stability AI Image Services in Amazon Bedrock

Amazon Bedrock now offers Stability AI Image Services: 9 tools that improve how businesses create and modify images. The technology extends Stable Diffusion and Stable Image models to give you precise control over image creation and editing. Clear prompts are critical—they provide art direction to the AI system. Strong prompts control specific elements like tone, […]

AWS Machine Learning Blog
api tool
No Image

AI Infra Summit at PyTorch Conference

2025年10月21日にサンフランシスコで開催されるAI Infra Summitは、AIの最新の革新を支えるインフラに関する専門家が集まるイベントです。この半日サミットでは、AIの急速な進展を促進するツールやプラットフォームについて議論され、トレーニング前後の処理、ファインチューニング、推論時間のスケーリング、モデル圧縮などの最適化が取り上げられます。参加者は、AIワークロードの効率的なスケーリングやトレーニング・推論の最適化、生成モデル時代のAIインフラの未来についての洞察を得ることができます。プログラムには基調講演、技術講演、パネルディスカッションが含まれ、モデル最適化や大規模トレーニング、新しい実行パラダイムに関心のある人々が集まります。 • AIインフラの最新の革新を支える専門家が集まるイベント • トレーニング前後の処理、ファインチューニング、推論時間のスケーリングなどが議論される • AIワークロードの効率的なスケーリングやトレーニング・推論の最適化についての洞察が得られる • 基調講演や技術講演、パネルディスカッションが行われる • モデル最適化や大規模トレーニングに関心のある人々が集まる

PyTorch Blog
cloud tool
I think "agent" may finally have a widely enough agreed upon definition to be useful jargon now

I think "agent" may finally have a widely enough agreed upon definition to be useful jargon now

I’ve noticed something interesting over the past few weeks: I’ve started using the term “agent” in conversations where I don’t feel the need to then define it, roll my eyes …

Simon Willison's Blog
platform
No Image

Experience in Reducing PT2 Compilation Time for Meta Internal Workloads

この記事では、Meta内部のワークロードにおけるPyTorch 2.0(PT2)のコンパイル時間を短縮する取り組みについて説明しています。PT2は、Pythonモデルコードを高性能な機械コードに変換するコンパイルステップを導入しましたが、大規模なモデルでは初期コンパイルがボトルネックとなることがあります。特に、Metaの内部推奨モデルでは、コンパイルに1時間以上かかることもあります。2024年末に、PT2のコンパイルプロセスを詳細に分析し、ボトルネックを特定するためにTlparseを使用しました。分析の結果、Dynamo、AOTInductor、TorchInductorなどの主要コンポーネントにおける時間消費の傾向が明らかになり、特にTorchInductorが67.8%を占めていることが分かりました。これに基づき、コンパイル時間を短縮するための具体的な改善策を特定し、実施しました。 • PT2のコンパイルが大規模モデルでボトルネックとなる問題を解決するための取り組み。 • Tlparseを用いてPT2のコンパイルプロセスを詳細に分析し、ボトルネックを特定。 • Dynamo、AOTInductor、TorchInductorの各コンポーネントの時間消費を分析。 • TorchInductorが67.8%の時間を占めていることが判明。 • コンパイル時間を短縮するために、最も時間を消費する領域の最適化やキャッシュ性能の向上を目指す。

PyTorch Blog
library tool
Discover three skilling insights that set Frontier Firms apart

Discover three skilling insights that set Frontier Firms apart

For Frontier Firms, AI skilling is a continuous investment. Learn how they use skill-building strategies to turn ambition into adoption with an AI-ready workforce.

Microsoft AI Blog
platform tool
Microsoft 365 Copilot: Enabling human-agent teams

Microsoft 365 Copilot: Enabling human-agent teams

Discover how Microsoft 365 Copilot’s new collaborative agents transform teamwork with AI-powered support in Teams, SharePoint, and Viva Engage.

Microsoft AI Blog
api cloud tool
Keep thinking with Claude

Keep thinking with Claude

There's never been a better time to be a problem solver. Claude is the AI collaborator that helps you think deeper—whether you're coding, creating, or reimagining what’s possible. Keep thinking. https://claude.com

YouTube Anthropic
langchain-mistralai==0.2.12

langchain-mistralai==0.2.12

この記事は、langchain-mistralaiのバージョン0.2.12のリリースに関するもので、主な変更点や修正内容が記載されています。新機能として、ls_model_nameをkwargsからオーバーライドできるようになったことが挙げられています。また、pytest-asyncioの非推奨警告に対処するための修正や、ドキュメントのフォーマットに関する問題の修正も行われました。さらに、Unicode変換に関する問題の修正や、OpenAIに関するドキュメントの改善も含まれています。これらの変更は、開発者体験の向上や、ドキュメントの明確化を目的としています。 • 新機能としてls_model_nameをkwargsからオーバーライド可能に • pytest-asyncioの非推奨警告に対処 • ドキュメントのフォーマットや記述の修正 • Unicode変換に関する問題を修正 • OpenAIに関するドキュメントを改善

langchain-ai/langchain
release tool
Monitor Amazon Bedrock batch inference using Amazon CloudWatch metrics

Monitor Amazon Bedrock batch inference using Amazon CloudWatch metrics

In this post, we explore how to monitor and manage Amazon Bedrock batch inference jobs using Amazon CloudWatch metrics, alarms, and dashboards to optimize performance, cost, and operational efficiency.

AWS Machine Learning Blog
api tool
Use AWS Deep Learning Containers with Amazon SageMaker AI managed MLflow

Use AWS Deep Learning Containers with Amazon SageMaker AI managed MLflow

In this post, we show how to integrate AWS DLCs with MLflow to create a solution that balances infrastructure control with robust ML governance. We walk through a functional setup that your team can use to meet your specialized requirements while significantly reducing the time and resources needed for ML lifecycle management.

AWS Machine Learning Blog
api framework tool
langchain-core==1.0.0a3

langchain-core==1.0.0a3

この記事は、Langchainのコアライブラリのバージョン1.0.0a3のリリースに関するもので、主にバグ修正や機能追加が行われたことを報告しています。具体的には、OpenAIデータブロックの公開化、PDFのURL経由でのサポート、ツール呼び出しのデフォルト値の保持、メッセージの変換時のステータスフィールドの保持などが含まれています。また、Pydantic v2の非推奨警告の解消や、ドキュメントの改善も行われています。これにより、ユーザーはより安定した機能を利用できるようになります。 • Langchainのコアライブラリのバージョン1.0.0a3がリリースされた。 • OpenAIデータブロックの公開化とフィルタリング機能が追加された。 • PDFをURL経由で標準形式でサポートする機能が追加された。 • ツール呼び出しのデフォルト値がJSONスキーマ表現で保持されることが確認された。 • Pydantic v2の非推奨警告が解消された。 • メッセージの変換時にステータスフィールドが保持されるよう修正された。

langchain-ai/langchain
library release tool
Discovering new solutions to century-old problems in fluid dynamics

Discovering new solutions to century-old problems in fluid dynamics

In a new paper, we introduce an entirely new family of mathematical blow ups to some of the most complex equations that describe fluid motion. Our approach presents a new way in which...

DeepMind Blog
api tool
What you need to know about vibe coding

What you need to know about vibe coding

Vibe coding is revolutionizing how we work. English is now the fastest growing programming language. Our state of vibe coding report outlines what you need to know.

Vercel Blog
api tool
We’re investing in connectivity, products and skills for Africa’s AI future

We’re investing in connectivity, products and skills for Africa’s AI future

As part of our ongoing commitment to Africa, Google is announcing new connectivity infrastructure, access to powerful AI tools, and skills.

Google AI Blog
api cloud tool
Building agentic copilots with CopilotKit and Mastra

Building agentic copilots with CopilotKit and Mastra

Learn how to build interactive, real-time agentic apps using CopilotKit as a frontend for Mastra agents.

Mastra Blog
ai framework tool
Democratizing AI Safety with RiskRubric.ai

Democratizing AI Safety with RiskRubric.ai

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api security tool
No Image

Anthropic: A postmortem of three recent issues

Anthropic had a very bad month in terms of model reliability: Between August and early September, three infrastructure bugs intermittently degraded Claude's response quality. We've now resolved these issues and …

Simon Willison's Blog
platform
No Image

ICPC medals for OpenAI and Gemini

In July it was the International Math Olympiad (OpenAI, Gemini), today it's the International Collegiate Programming Contest (ICPC). Once again, both OpenAI and Gemini competed with models that achieved Gold …

Simon Willison's Blog
platform
Agent Factory: Creating a blueprint for safe and secure AI agents

Agent Factory: Creating a blueprint for safe and secure AI agents

Learn how you can build trustworthy AI agents by combining identity, guardrails, evaluations, adversarial testing, data protection, and more.

Microsoft AI Blog
platform tool
Supercharge your organization’s productivity with the Amazon Q Business browser extension

Supercharge your organization’s productivity with the Amazon Q Business browser extension

In this post, we showed how to use the Amazon Q Business browser extension to give your team seamless access to AI-driven insights and assistance. The browser extension is now available in US East (N. Virginia) and US West (Oregon) AWS Regions for Mozilla, Google Chrome, and Microsoft Edge as part of the Lite Subscription.

AWS Machine Learning Blog
api tool
Build Agentic Workflows with OpenAI GPT OSS on Amazon SageMaker AI and Amazon Bedrock AgentCore

Build Agentic Workflows with OpenAI GPT OSS on Amazon SageMaker AI and Amazon Bedrock AgentCore

In this post, we show how to deploy gpt-oss-20b model to SageMaker managed endpoints and demonstrate a practical stock analyzer agent assistant example with LangGraph, a powerful graph-based framework that handles state management, coordinated workflows, and persistent memory systems.

AWS Machine Learning Blog
framework tool
2025-09-17

2025-09-17

この記事は、mastra-aiのリリースノートに関するもので、2025年9月17日に行われた更新内容を詳述しています。主な変更点には、OpenAIの推論スキーマにおけるZod v4との互換性向上、エージェントのテキストビュー内でのマークダウンのストリーム表示、UIの整合性向上のためのスコアバッジの表示改善、CLIのエラー処理の強化、ローカルHTTPSサポートの追加、ダイナミックフォームレンダリングの改善、PostgreSQLストレージアダプタのクエリパフォーマンス向上などが含まれています。これらの変更は、ユーザーエクスペリエンスの向上や、開発者の利便性を高めることを目的としています。 • OpenAI推論スキーマのZod v4との互換性を向上させた。 • エージェントのテキストビューでマークダウンをストリーム表示する機能を追加。 • CLIのエラー処理を強化し、Node.jsプロジェクト外での実行時にエラーを表示。 • ローカルHTTPSサポートを追加し、コマンドラインフラグまたは設定オプションで有効化可能。 • PostgreSQLストレージアダプタに自動複合インデックスと包括的なインデックス管理機能を追加し、クエリパフォーマンスを向上。

mastra-ai/mastra
api database release
No Image

High-performance quantized LLM inference on Intel CPUs with native PyTorch

PyTorch 2.8では、Intel Xeonプロセッサ上での高性能な量子化LLM推論が可能になりました。新機能として、libtorch ABIの安定版、Wheel Variant Support、Inductor CUTLASSバックエンドサポートなどが追加され、特に量子化設定が最適化されています。これにより、PyTorchは他のLLMフレームワークと比較しても競争力のある低精度性能を提供します。ユーザーは、AMXサポートのあるX86 CPUを選び、Torchaoの量子化手法を用いてモデルを量子化し、torch.compileを使用して最適化を自動的に適用することで、パフォーマンスを向上させることができます。 • PyTorch 2.8でIntel Xeonプロセッサ上のLLM推論が高性能化された。 • 量子化設定(A16W8、DA8W8、A16W4など)が最適化され、競争力のある性能を実現。 • torch.compileを使用して、量子化モデルのパフォーマンスを向上させることができる。 • ユーザーはAMXサポートのあるX86 CPUを選ぶ必要がある。 • Torchaoの量子化手法を用いてモデルを量子化する必要がある。

PyTorch Blog
library tool
Gemini achieved gold-medal performance at the International Collegiate Programming Contest World Finals.

Gemini achieved gold-medal performance at the International Collegiate Programming Contest World Finals.

Gemini achieves gold status at the ICPC, marking a new leap in AI's abstract problem-solving.

Google AI Blog
platform
sdk==0.2.8

sdk==0.2.8

この記事は、LangchainのSDKのバージョン0.2.8のリリースに関する情報を提供しています。このリリースでは、Python SDKにおいてSSEストリームの再接続を処理する修正が行われました。リリース日は2023年9月17日で、GitHub上で公開されています。バージョン0.2.8は、前のバージョン0.2.7からの変更点を含んでおり、開発者がより安定したストリーミング体験を得られるように改善されています。 • バージョン0.2.8のリリース日: 2023年9月17日 • Python SDKにおけるSSEストリームの再接続処理の修正 • 前のバージョン0.2.7からの改善点 • GitHub上で公開されたリリース情報

langchain-ai/langgraph
release tool
Making LLMs more accurate by using all of their layers

Making LLMs more accurate by using all of their layers

この記事では、SLED(Self Logits Evolution Decoding)という新しいデコーディング戦略を紹介しています。この手法は、LLM(大規模言語モデル)の出力をモデルの内在的な知識と整合させることで、外部データや追加のファインチューニングなしに精度を向上させることを目的としています。LLMは時折、事実に基づかない主張を行う「幻覚」問題を抱えており、これは不完全または偏ったトレーニングデータや、あいまいな質問などが原因です。SLEDは、LLMのすべての層を使用してテキストを生成し、最終層だけに依存せずに出力を調整します。実験の結果、SLEDはさまざまなタスクやベンチマークで事実の正確性を一貫して改善することが示されました。さらに、他の事実性デコーディング手法と柔軟に統合できることも確認されています。 • LLMの幻覚問題を解決するための新しいデコーディング手法SLEDを提案 • SLEDは外部データやファインチューニングを必要とせず、モデルの内在的知識に基づいて出力を調整 • LLMのすべての層を使用してテキストを生成し、最終層だけに依存しない • 実験により、SLEDがさまざまなタスクで事実の正確性を向上させることが確認された • SLEDは他の事実性デコーディング手法と統合可能で、モデルの幻覚をさらに減少させることができる

Google Research
api tool
Gemini achieves gold-level performance at the International Collegiate Programming Contest World Finals

Gemini achieves gold-level performance at the International Collegiate Programming Contest World Finals

An advanced version of Gemini 2.5 Deep Think has achieved gold-medal level performance at the 2025 International Collegiate Programming Contest (ICPC) World Finals. Solving complex tasks at these...

DeepMind Blog
api tool
Investing in America 2025

Investing in America 2025

Google’s deep investments in American technical infrastructure, R&D and the workforce will help the U.S. continue to lead the world in AI.

Google AI Blog
cloud
How to stop your AI agents from hallucinating: A guide to n8n’s Eval Node

How to stop your AI agents from hallucinating: A guide to n8n’s Eval Node

Walk through a practical example of n8n's Eval feature, which helps developers reduce hallucinations and increase reliability of AI products.

logrocket-dev
tool
Generate static AI SDK tools from MCP servers with mcp-to-ai-sdk

Generate static AI SDK tools from MCP servers with mcp-to-ai-sdk

Use mcp-to-ai-sdk to generate MCP tools directly into your project. Gain security, reliability, and prompt-tuned control while avoiding dynamic MCP risks.

Vercel Blog
api tool
Cognition (Windsurf) Named a Leader in the 2025 Gartner® Magic Quadrant™ for AI Code Assistants

Cognition (Windsurf) Named a Leader in the 2025 Gartner® Magic Quadrant™ for AI Code Assistants

Cognition’s Windsurf has been named a Leader in the 2025 Gartner® Magic Quadrant™ for AI Code Assistant

Windsurf Blog
tool
Smart Schema Discovery: How Apollo MCP Server Maximizes AI Context Efficiency

Smart Schema Discovery: How Apollo MCP Server Maximizes AI Context Efficiency

Unlock microservices potential with Apollo GraphQL. Seamlessly integrate APIs, manage data, and enhance performance. Explore Apollo's innovative solutions.

apollo-blog
api framework tool
 Patch release v4.56.2

Patch release v4.56.2

この記事は、Hugging FaceのTransformersライブラリのバージョン4.56.2のパッチリリースについて説明しています。このリリースでは、マルチプロセッシングによるプロセッサ負荷の改善、RoPEの修正、getterの回帰修正、Emu3のエッジケースに対する設定dtype解析の修正が行われました。これにより、ライブラリの安定性とパフォーマンスが向上しています。 • マルチプロセッシングによるプロセッサ負荷の改善が行われた • RoPEに関するバグが修正された • getterの回帰に関する問題が修正された • Emu3のエッジケースに対する設定dtype解析が修正された • ライブラリの安定性とパフォーマンスが向上した

huggingface/transformers
library release
Public AI on Hugging Face Inference Providers 🔥

Public AI on Hugging Face Inference Providers 🔥

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api tool
Detecting and reducing scheming in AI models

Detecting and reducing scheming in AI models

Together with Apollo Research, we developed evaluations for hidden misalignment (“scheming”) and found behaviors consistent with scheming in controlled tests across frontier models. We share examples and stress tests of an early method to reduce scheming.

OpenAI Blog
tool
cli-1.1.10

cli-1.1.10

この記事は、GitHub上のchroma-coreリポジトリにおけるcli-1.1.10のリリースに関する情報を提供しています。このリリースは2023年9月16日に行われ、GitHubの検証済み署名で作成されたことが記載されています。リリースには6つのアセットが含まれていることが示されていますが、具体的な内容や変更点については詳細が記載されていません。また、ページの読み込み中にエラーが発生したことも言及されています。 • cli-1.1.10のリリース日が2023年9月16日であること • リリースはGitHubの検証済み署名で作成されたこと • リリースには6つのアセットが含まれていること • ページの読み込み中にエラーが発生したこと

chroma-core/chroma
release tool
1.1.0

1.1.0

Chromaのバージョン1.1.0がリリースされ、いくつかの重要な改善が行われた。主な変更点には、高いカーディナリティの圧縮メトリクスの修正、ガーベジコレクション用の制御インターフェースの追加、検索APIのクリーンアップ、BM25インデックス用のidf修飾子の実装が含まれる。また、メトリクスの改善や新しいクエリ設定の追加も行われた。さらに、PythonとCLIの新しいリリースも含まれている。これにより、Chromaのパフォーマンスと機能が向上し、ユーザーにとっての利便性が増すことが期待される。 • 高いカーディナリティの圧縮メトリクスの修正 • ガーベジコレクション用の制御インターフェースの追加 • 検索APIのクリーンアップ • BM25インデックス用のidf修飾子の実装 • PythonとCLIの新しいリリースの提供

chroma-core/chroma
library release tool
No Image

Announcing the 2025 PSF Board Election Results!

I'm happy to share that I've been re-elected for second term on the board of directors of the Python Software Foundation. Jannis Leidel was also re-elected and Abigail Dogbe and …

Simon Willison's Blog
tool
langchain-tests==1.0.0a1

langchain-tests==1.0.0a1

この記事は、Langchainのテストフレームワークであるlangchain-testsのバージョン1.0.0a1のリリースに関するものである。このリリースでは、標準テストの機能が追加され、特定のベクターストアがget_by_ids()をサポートしていない場合に関連するテストをスキップするプロパティが導入された。また、非負のトークンカウントを使用メタデータのアサーションにおいて保証する修正が行われた。さらに、mypyのバージョンが1.18に引き上げられ、Python 3.9のサポートが削除された。ドキュメントの修正や、Ruffのルールの追加、ベンチマークの実行なども含まれている。 • Langchainのテストフレームワークの初回リリース • 特定のベクターストアがget_by_ids()をサポートしない場合にテストをスキップする機能の追加 • 非負のトークンカウントを保証する修正 • mypyのバージョンを1.18に引き上げ • Python 3.9のサポートを削除 • ドキュメントの修正とRuffのルールの追加 • ベンチマークの実行を常に行うように設定

langchain-ai/langchain
release tool
Learn Your Way uses AI to transform textbook materials into interactive guides.

Learn Your Way uses AI to transform textbook materials into interactive guides.

Learn Your Way uses AI to transform textbook materials into interactive guides.

Google AI Blog
tool
Learn Your Way: Reimagining textbooks with generative AI

Learn Your Way: Reimagining textbooks with generative AI

この記事では、教育における生成AI(GenAI)を活用した新しい教科書の再構想について述べています。Googleの研究チームは、学習者が自分の学習体験を形作ることができるように、さまざまな形式や個別化された例を自動生成する方法を探求しています。新しいインタラクティブな体験「Learn Your Way」がGoogle Labsで提供されており、これにより学習者は多様な形式で教材を探索できるようになります。研究によると、「Learn Your Way」を使用した学生は、標準的なデジタルリーダーを使用した学生よりも保持テストで11ポイント高いスコアを記録しました。この記事では、学習体験を向上させるための二つの主要な柱、すなわち多様なコンテンツ表現の生成と個別化の基礎的なステップについて説明しています。 • 生成AIを用いて教科書の代替表現や個別化された例を自動生成する方法を探求している。 • 新しいインタラクティブ体験「Learn Your Way」がGoogle Labsで提供されている。 • 「Learn Your Way」を使用した学生は、標準的なデジタルリーダーを使用した学生よりも保持テストで11ポイント高いスコアを記録した。 • 学習者が選択できる多様な形式やモダリティを提供し、学習体験を強化する。 • 個別化された学習体験を提供するために、学習者の属性に応じて教育コンテンツを適応させる。

Google Research
api cloud tool
Streamline access to ISO-rating content changes with Verisk rating insights and Amazon Bedrock

Streamline access to ISO-rating content changes with Verisk rating insights and Amazon Bedrock

In this post, we dive into how Verisk Rating Insights, powered by Amazon Bedrock, large language models (LLM), and Retrieval Augmented Generation (RAG), is transforming the way customers interact with and access ISO ERC changes.

AWS Machine Learning Blog
api tool
Unified multimodal access layer for Quora’s Poe using Amazon Bedrock

Unified multimodal access layer for Quora’s Poe using Amazon Bedrock

In this post, we explore how the AWS Generative AI Innovation Center and Quora collaborated to build a unified wrapper API framework that dramatically accelerates the deployment of Amazon Bedrock FMs on Quora’s Poe system. We detail the technical architecture that bridges Poe’s event-driven ServerSentEvents protocol with Amazon Bedrock REST-based APIs, demonstrate how a template-based configuration system reduced deployment time from days to 15 minutes, and share implementation patterns for protocol translation, error handling, and multi-modal capabilities.

AWS Machine Learning Blog
api cloud tool
Release v3.28.3

Release v3.28.3

RooCodeIncのRoo-Codeリポジトリでのリリースv3.28.3では、いくつかのバグ修正と機能改善が行われた。具体的には、Claude Codeのビルトインツールをフィルタリングする修正、タスク追加ボタンのアイコンを新しいものに変更、C#のtree-sitterクエリの修正、コンテキストに追加するアクションのキーボードショートカットの追加、編集メッセージ時にコンテキストメニューが隠れる問題の修正、OpenAIエンベッダーでのByteString変換エラーの処理、Z.aiコーディングプランのサポート追加、スラッシュコマンドを設定タブに移動する改善、テキストエリア内のボタン表示の条件変更などが含まれている。これらの変更により、ユーザーエクスペリエンスが向上し、操作性が改善されることが期待される。 • Claude Codeのビルトインツールをフィルタリングする修正が行われた。 • タスク追加ボタンのアイコンが新しいものに変更された。 • C#のtree-sitterクエリが修正された。 • コンテキストに追加するアクションのキーボードショートカットが追加された。 • 編集メッセージ時にコンテキストメニューが隠れる問題が修正された。 • OpenAIエンベッダーでのByteString変換エラーの処理が行われた。 • Z.aiコーディングプランのサポートが追加された。 • スラッシュコマンドが設定タブに移動され、発見しやすくなった。

RooCodeInc/Roo-Code
release tool
sdk==0.2.7

sdk==0.2.7

この記事は、LangchainのSDKのバージョン0.2.7のリリースに関するものである。主な変更点として、SSEストリームがトレーリングイベントをフラッシュすることを保証する修正が含まれている。また、依存関係のアップグレードや、ドキュメンテーションのインデントのクリーンアップ、get_clientのドキュメンテーションの整理も行われた。これにより、SDKの安定性と使いやすさが向上している。 • SSEストリームのトレーリングイベントをフラッシュする修正が行われた。 • 依存関係のアップグレードが実施された。 • ドキュメンテーションのインデントが整理された。 • get_clientのドキュメンテーションがクリーンアップされた。 • SDKの安定性と使いやすさが向上した。

langchain-ai/langgraph
release tool
From Signal blog: How AI is quietly rewriting the rules of modern medicine

From Signal blog: How AI is quietly rewriting the rules of modern medicine

From diagnosing rare conditions to improving the patient experience, AI is transforming how we practice medicine.

Microsoft AI Blog
platform tool
No Image

Introducing Stargate UK

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AIを活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
Let’s kill vibe coding and bring back prompt engineering

Let’s kill vibe coding and bring back prompt engineering

Vibe coding is trending, but is it sustainable? Explore why prompt engineering still matters for building reliable, high-quality AI apps.

logrocket-dev
tool
AI agents at scale: Rox’s Vercel-powered revenue operating system

AI agents at scale: Rox’s Vercel-powered revenue operating system

Learn more about how Rox runs global, AI-driven sales ops on fast, reliable infrastructure thanks to Vercel

Vercel Blog
api tool
openai/codex でのプロジェクト固有MCPを設定する

openai/codex でのプロジェクト固有MCPを設定する

この記事では、OpenAIのCodexを使用してプロジェクト固有のMCP(Model Context Protocol)を設定する方法について説明しています。CodexはグローバルにMCPを設定することしかできないため、プロジェクトごとに独立した設定が必要です。2つの手段が提案されており、1つ目は環境変数を使用して読み込みディレクトリを変更し、プロジェクト固有の設定をロードする方法です。しかし、この方法では認証情報が含まれるため、普段使いには適していません。2つ目の手段は、Codexのコマンドラインオプションを使用して直接TOML設定をロードする方法で、こちらの方が安全です。具体的なコマンドや設定例も示されており、実装に関する注意点も記載されています。 • CodexはグローバルにMCPを設定するが、プロジェクトごとに独立した設定が必要な場合がある。 • 手段1では環境変数を使用してプロジェクト固有のMCP設定をロードできるが、認証情報が含まれるため普段使いには不向き。 • 手段2では--configオプションを使用して直接TOMLをロードする方法があり、こちらが安全とされる。 • 具体的なコマンドや設定例が示されており、実装方法が詳細に説明されている。 • JSONからTOMLへの変換に関する注意点も記載されている。

Zenn mizchi
api tool
No Image

Teen safety, freedom, and privacy

この記事では、最新のJavaScriptフレームワークであるNext.jsの新機能について詳しく解説しています。特に、画像最適化機能や新しいデータフェッチングの手法が強調されており、これにより開発者はパフォーマンスを向上させることができます。また、Next.jsの新しいAPIルート機能により、サーバーサイドでのデータ処理が簡素化され、開発の効率が向上します。さらに、これらの機能はSEO対策にも寄与し、ユーザーエクスペリエンスを向上させることが期待されています。 • Next.jsの新機能として画像最適化が追加され、パフォーマンス向上に寄与する。 • 新しいデータフェッチング手法により、開発者は効率的にデータを取得できる。 • APIルート機能の強化により、サーバーサイドでのデータ処理が簡素化される。 • これらの機能はSEO対策にも効果があり、ユーザーエクスペリエンスを向上させる。

OpenAI Blog
tool
No Image

Building towards age prediction

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
Introducing Output Processors

Introducing Output Processors

Introducing output processors: the gatekeepers that sit between your language model's response and your users.

Mastra Blog
ai api framework
`LeRobotDataset`: Bringing large-scale datasets to lerobot

`LeRobotDataset`: Bringing large-scale datasets to lerobot

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
library tool
GPT‑5-Codex and upgrades to Codex

GPT‑5-Codex and upgrades to Codex

OpenAI half-released a new model today: GPT‑5-Codex, a fine-tuned GPT-5 variant explicitly designed for their various AI-assisted programming tools. I say half-released because it's not yet available via their API, …

Simon Willison's Blog
api library tool
Listen to a discussion on how AI can power scientific breakthroughs.

Listen to a discussion on how AI can power scientific breakthroughs.

Pushmeet Kohli, who leads DeepMind’s science and strategic initiatives team, discusses AI and science.

Google AI Blog
podcast
Codex and the future of coding with AI — the OpenAI Podcast Ep. 6

Codex and the future of coding with AI — the OpenAI Podcast Ep. 6

What happens when AI becomes a true coding collaborator? OpenAI co-founder Greg Brockman and Codex engineering lead Thibault Sottiaux talk about the evolution of Codex—from the first glimpses of AI writing code, to today’s GPT-5 Codex agents that can work for hours on complex refactorings. They discuss building “harnesses,” the rise of agentic coding, code review breakthroughs, and how AI may transform software development in the years ahead. Chapters 1:15 – The first sparks of AI coding with GPT-3 4:00 – Why coding became OpenAI’s deepest focus area 7:20 – What a “harness” is and why it matters for agents 11:45 – Lessons from GitHub Copilot and latency tradeoffs 16:10 – Experimenting with terminals, IDEs, and async agents 22:00 – Internal tools like 10x and Codex code review 27:45 – Why GPT-5 Codex can run for hours on complex tasks 33:15 – The rise of refactoring and enterprise use cases 38:50 – The future of agentic software engineers 45:00 – Safety, oversight, and aligning agents with human intent 51:30 – What coding (and compute) may look like in 2030 57:40 – Advice: why it’s still a great time to learn to code

YouTube OpenAI
Schedule topology-aware workloads using Amazon SageMaker HyperPod task governance

Schedule topology-aware workloads using Amazon SageMaker HyperPod task governance

In this post, we introduce topology-aware scheduling with SageMaker HyperPod task governance by submitting jobs that represent hierarchical network information. We provide details about how to use SageMaker HyperPod task governance to optimize your job efficiency.

AWS Machine Learning Blog
api tool
How msg enhanced HR workforce transformation with Amazon Bedrock and msg.ProfileMap

How msg enhanced HR workforce transformation with Amazon Bedrock and msg.ProfileMap

In this post, we share how msg automated data harmonization for msg.ProfileMap, using Amazon Bedrock to power its large language model (LLM)-driven data enrichment workflows, resulting in higher accuracy in HR concept matching, reduced manual workload, and improved alignment with compliance requirements under the EU AI Act and GDPR.

AWS Machine Learning Blog
cloud tool
How AI is helping 38 million farmers with advance weather predictions

How AI is helping 38 million farmers with advance weather predictions

38 million farmers in India received accurate AI-powered forecasts of the start of the monsoon season.

Google AI Blog
api tool
Newsroom

Newsroom

To study such patterns of early AI adoption, we extend the Anthropic Economic Index along two important dimensions, introducing a geographic analysis of Claude.ai conversations and a first-of-its-kind examination of enterprise API use. We show how Claude usage has evolved over time, how adoption patterns differ across regions, and—for the first time—how firms are deploying frontier AI to solve business problems.

Anthropic News
ai anthropic llm
Introducing upgrades to Codex

Introducing upgrades to Codex

Codex just got faster, more reliable, and better at real-time collaboration and tackling tasks independently anywhere you develop—whether via the terminal, IDE, web, or even your phone.

OpenAI Blog
tool
How people are using ChatGPT

How people are using ChatGPT

Largest study to date of consumer ChatGPT usage shows demographic gaps shrinking, economic value being created through both personal and professional use.

OpenAI Blog
tool
Introducing auto model selection (preview)

Introducing auto model selection (preview)

Use auto model selection in VS Code to get faster responses, reduced rate limiting, and a 10% discount on premium requests for paid users.

VS Code Blog
api cloud tool
No Image

Models can prompt now

Here's an interesting example of models incrementally improving over time: I am finding that today's leading models are competent at writing prompts for themselves and each other. A year ago …

Simon Willison's Blog
platform
Release v3.28.2

Release v3.28.2

RooCodeIncのGitHubリポジトリでリリースされたバージョン3.28.2では、いくつかの重要な改善と修正が行われた。自動承認UIがより小さく、控えめなデザインに改善され、Task.ask()におけるメッセージキューの再キューイングループによるパフォーマンス問題が修正された。また、@-メンションの解析が行の開始または空白の境界に制限され、誤ったトリガーを防ぐための修正も行われた。さらに、ネストされたGitリポジトリの警告がパス情報と共に持続的に表示されるようになり、Ollamaの/api/tagsリクエストにAPIキーが含まれるようになった。会話の要約中に元の最初のメッセージのコンテキストを保持する機能も追加され、Qwen3 Next 80B A3Bモデルがchutesプロバイダーに追加された。ログアウト時にRoomote Controlが無効化され、セキュリティが向上した。 • 自動承認UIのデザイン改善 • Task.ask()のパフォーマンス問題修正 • @-メンション解析の誤トリガー防止 • ネストされたGitリポジトリ警告の持続的表示 • OllamaのAPIリクエストにAPIキーを含める • 会話要約中の元メッセージコンテキスト保持 • Qwen3 Next 80B A3Bモデルの追加 • ログアウト時のRoomote Control無効化によるセキュリティ向上

RooCodeInc/Roo-Code
release tool
🥇Top AI Papers of the Week

🥇Top AI Papers of the Week

The Top AI Papers of the Week (September 8-14)

Elvis Saravia's NLP Blog
platform
メインブラウザをEdgeに切り替えた理由とAIブラウザの可能性

メインブラウザをEdgeに切り替えた理由とAIブラウザの可能性

ChromeからEdgeに乗り換え 最近、筆者はAI統合型のブラウザを常用するべくメインブラウザをGoogle ChromeからMicrosoft Edgeに切り替えました。EdgeのCopilot Modeは8月にGPT-5が搭載され、かなり使い勝手が良くなりました。2年前にこの前哨戦となる「Bing AIチャットをデフォルトのウェブ検索にして使ってみた」を投稿したのですが、当時と比べると雲泥の差です。 この記事では、筆者がEdgeへの移行を検討するに至った背景や、実際の使用感について整理しました。また、AIブラウザの台頭に伴い、セキュリティ面での新たなリスクについても考えることになったのでそれを喚起します。 移行の動機 筆者がメインブラウザをChromeからEdgeに移行した最大の理由は、AI統合型のウェブブラウジングを日常にしたかったからでした。実は2年前にもプログラミングにAI機能を使いたいという理由で、エディタをJetBrainsから強制的にVSCode/Cursorに移行した経験があり、それを思い出します。 現在、ブラウザやOSとLLMの統合は急速に進んでいます

Lai.so Blog
tool ui
🤖 AI Agents Weekly: Agent 3, ChatGPT Developer Mode, MCP Registry, Writing Effective Tools for Agents, Qodo Aware

🤖 AI Agents Weekly: Agent 3, ChatGPT Developer Mode, MCP Registry, Writing Effective Tools for Agents, Qodo Aware

Agent 3, ChatGPT Developer Mode, MCP Registry, Writing Effective Tools for Agents, Qodo Aware

Elvis Saravia's NLP Blog
library tool
自然言語で CI/CD パイプラインを定義する Agentic Workflows

自然言語で CI/CD パイプラインを定義する Agentic Workflows

Agentic Workflows は自然言語で CI/CD パイプラインを定義できるツールとして GitHub Next が開発しています。自然言語で定義されたワークフローは GitHub CLI の拡張機能として提供される gh aw コマンドでコンパイルして実行できます。これは継続体なAI(Continuous AI)を実現するためのツールです。

azukiazusa のテックブログ2
api tool
No Image

gpt-5 and gpt-5-mini rate limit updates

OpenAI have increased the rate limits for their two main GPT-5 models. These look significant: gpt-5 Tier 1: 30K → 500K TPM (1.5M batch) Tier 2: 450K → 1M (3M …

Simon Willison's Blog
api
No Image

Quoting Matt Webb

The trick with Claude Code is to give it large, but not too large, extremely well defined problems. (If the problems are too large then you are now vibe coding… …

Simon Willison's Blog
platform
No Image

PyTorch 2.8 Brings Native XCCL Support to Intel GPUs: Case Studies from Argonne National Laboratory

PyTorch 2.8では、Intel GPU向けにXCCLバックエンドのネイティブ統合が実現され、分散トレーニングのサポートが強化されました。この新機能により、開発者はIntelハードウェア上でAIワークロードをスケールさせるためのシームレスな体験を得られます。これまでPyTorchにはIntel GPUでの分散トレーニングの組み込み方法がなく、ユーザーは高度な機能を十分に活用できませんでしたが、XCCLバックエンドの導入によりこのギャップが解消されました。XCCLは、NCCLやGlooなどの既存のバックエンドと一貫性のある分散APIを提供し、信頼性を確保するためにテストが再構築されました。PyTorch 2.8では、Intel XPUデバイス上で自動的にXCCLがデフォルトバックエンドとして選択され、ユーザーは簡単に利用できます。Argonne国立研究所との共同作業により、Auroraスーパーコンピュータを使用して気候モデリングや薬剤発見などの課題に取り組むことが可能になりました。 • PyTorch 2.8でIntel GPU向けにXCCLバックエンドが統合された。 • 分散トレーニングのサポートが強化され、開発者はシームレスな体験を得られる。 • XCCLバックエンドの導入により、Intel GPUでの高度な機能が利用可能になった。 • XCCLはNCCLやGlooと一貫性のある分散APIを提供し、信頼性を確保している。 • PyTorch 2.8では、Intel XPUデバイス上で自動的にXCCLがデフォルトバックエンドとして選択される。 • Argonne国立研究所のAuroraスーパーコンピュータを利用して、AIによる科学研究が進められている。

PyTorch Blog
library tool
Automate advanced agentic RAG pipeline with Amazon SageMaker AI

Automate advanced agentic RAG pipeline with Amazon SageMaker AI

In this post, we walk through how to streamline your RAG development lifecycle from experimentation to automation, helping you operationalize your RAG solution for production deployments with Amazon SageMaker AI, helping your team experiment efficiently, collaborate effectively, and drive continuous improvement.

AWS Machine Learning Blog
tool
Unlock model insights with log probability support for Amazon Bedrock Custom Model Import

Unlock model insights with log probability support for Amazon Bedrock Custom Model Import

In this post, we explore how log probabilities work with imported models in Amazon Bedrock. You will learn what log probabilities are, how to enable them in your API calls, and how to interpret the returned data. We also highlight practical applications—from detecting potential hallucinations to optimizing RAG systems and evaluating fine-tuned models—that demonstrate how these insights can improve your AI applications, helping you build more trustworthy solutions with your custom models.

AWS Machine Learning Blog
tool
Migrate from Anthropic’s Claude 3.5 Sonnet to Claude 4 Sonnet on Amazon Bedrock

Migrate from Anthropic’s Claude 3.5 Sonnet to Claude 4 Sonnet on Amazon Bedrock

This post provides a systematic approach to migrating from Anthropic’s Claude 3.5 Sonnet to Claude 4 Sonnet on Amazon Bedrock. We examine the key model differences, highlight essential migration considerations, and deliver proven best practices to transform this necessary transition into a strategic advantage that drives measurable value for your organization.

AWS Machine Learning Blog
api cloud tool
No Image

Disaggregated Inference at Scale with PyTorch & vLLM

この記事では、PyTorchとvLLMの統合による生成AIアプリケーションの効率化について説明しています。特に、Prefill/Decode Disaggregationという技術が、レイテンシとスループットの両面で生成AI推論の効率を向上させることに焦点を当てています。この技術はMetaの内部推論スタックで実装され、大規模なトラフィックに対応しています。MetaとvLLMチームの協力により、Metaの内部LLM推論スタックと比較してパフォーマンスが向上しました。PrefillとDecodeの処理を分離することで、リソースの効率的な利用が可能になり、レイテンシとスループットの改善が実現されます。記事では、TCPネットワーク上での最適なP/D分離サービスを実現するための3つの主要コンポーネントについても触れています。 • PyTorchとvLLMの統合により生成AIアプリケーションの効率化が図られている。 • Prefill/Decode Disaggregation技術がレイテンシとスループットを向上させる。 • Metaの内部推論スタックでの実装により、大規模トラフィックに対応可能。 • MetaとvLLMの協力により、パフォーマンスが向上した。 • PrefillとDecodeの処理を分離することで、リソースの効率的な利用が実現される。 • TCPネットワーク上での最適なP/D分離サービスを実現するための3つの主要コンポーネントがある。

PyTorch Blog
library tool
10 examples of our new native image editing in the Gemini app

10 examples of our new native image editing in the Gemini app

A new Google DeepMind image editing model, fondly known as Nano Banana, is now in the Gemini app, giving you more creative control to blend and edit photos. Here are 10 …

Google AI Blog
tool ui
Exploring Vibe Coding and the Future of Product Management with Gunnar Berger - JSJ 690

Exploring Vibe Coding and the Future of Product Management with Gunnar Berger - JSJ 690

In this episode of JavaScript Jabber, I sit down with Amazon product leader Gunnar Berger to dive into the fast-evolving world of vibe coding and how it’s res

javascript-jabber
api tool
Vault-Gemma (based on v4.56.1)

Vault-Gemma (based on v4.56.1)

この記事では、Hugging FaceのTransformersライブラリに新たに追加されたモデル「Vault-Gemma」について説明しています。このモデルは、バージョン4.56.1に基づいており、テキスト専用のデコーダーモデルです。Vault-Gemmaは、1Bパラメータを持ち、1024トークンのシーケンス長を使用して訓練されています。訓練には、シーケンスレベルの差分プライバシー(DP)が適用されており、DP確率的勾配降下法(DP-SGD)を使用しています。モデルのインストール方法や、テキスト生成のための使用例も示されています。Vault-Gemmaは、次のマイナーリリースであるv4.57.0に含まれる予定です。 • 新モデルVault-GemmaがTransformersライブラリに追加された • Vault-Gemmaはテキスト専用のデコーダーモデルで、1Bパラメータを持つ • モデルは1024トークンのシーケンス長を使用して訓練された • シーケンスレベルの差分プライバシー(DP)が適用されている • DP-SGDを使用して訓練され、プライバシー保証が提供されている • モデルのインストール方法が示されている • テキスト生成の使用例が提供されている

huggingface/transformers
api library release
langchain==1.0.0a5

langchain==1.0.0a5

この記事は、LangChainのバージョン1.0.0a5のリリースに関する情報を提供しています。このリリースでは、いくつかの修正や機能追加が行われました。具体的には、モデルリクエストからのメッセージ使用の修正、特別な文字を使用した場合のmermaidノードIDの衝突解決、PEP604(| union)をサポートするツールノードエラーハンドラーの追加、エージェント作成時のミドルウェアサポートの追加などが含まれています。また、mypyのバージョンの更新や、ドキュメントの改善も行われています。これにより、LangChainの機能が向上し、開発者にとって使いやすくなっています。 • LangChainのバージョン1.0.0a5がリリースされた。 • モデルリクエストからのメッセージ使用に関する修正が行われた。 • mermaidノードIDの衝突を解決する修正が含まれている。 • PEP604をサポートするツールノードエラーハンドラーが追加された。 • エージェント作成時にミドルウェアサポートが追加された。 • mypyのバージョンが更新された。 • ドキュメントの改善が行われ、開発者向けの使いやすさが向上した。

langchain-ai/langchain
release tool
402-mcp enables x402 payments in MCP

402-mcp enables x402 payments in MCP

Introducing x402-mcp, a library that integrates with the AI SDK to bring x402 paywalls to Model Context Protocol (MCP) servers to let agents discover and call pay for MCP tools easily and securely.

Vercel Blog
api tool
Introducing x402-mcp: Open protocol payments for MCP tools

Introducing x402-mcp: Open protocol payments for MCP tools

We built x402-mcp to integrate x402 payments with Model Context Protocol (MCP) servers and the Vercel AI SDK.

Vercel Blog
api cloud tool
No Image

Working with US CAISI and UK AISI to build more secure AI systems

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントや関数名に基づいて、AIが適切なコードを提案する機能があります。また、このツールは既存の開発環境に簡単に統合できるように設計されており、特にJavaScriptやTypeScriptのプロジェクトでの使用が推奨されています。これにより、開発の効率が向上し、エラーの削減が期待されます。 • AIを活用したコード自動生成ツールの紹介 • 開発者が入力した情報に基づいてコードを提案する機能 • JavaScriptやTypeScriptプロジェクトへの統合が容易 • 開発効率の向上とエラー削減が期待される • 生成AIを利用した新しい開発手法の提案

OpenAI Blog
library tool
今週の話題:Claudeの劣化問題の修正、Claude Code API差し替え、sonoma-alpha

今週の話題:Claudeの劣化問題の修正、Claude Code API差し替え、sonoma-alpha

AnthropicがClaudeの性能劣化に対応 Anthropicが公式に、8月からコミュニティで報告されていたClaude Sonnetの性能劣化を修正したと発表しました。原因は推論スタックのインフラ層にあり、独立したバグによるものであり「モデル本体の意図的な性能ダウン」や「需要対策によるダウングレード」は否定されています。 Model output qualityAnthropic’s Status Page - Model output quality.Model output quality 発表には、2025年8月下旬〜9月初旬にかけてSonnet 4系で品質劣化(degraded output quality)が発生し、8月5日〜9月4日には少数のSonnet 4.0リクエストに出力品質の低下が見られたという記載があります。Opus 4.1にはいまだ未解決の問題もあります。 8月中にはRedditでClaude Codeの応答劣化の件は炎上していました。有料プランの週次制限の開始あたりから加熱した印象です。一部ではCodex CLIに乗り換えようという声がありまし

Lai.so Blog
api tool
VaultGemma: The world's most capable differentially private LLM

VaultGemma: The world's most capable differentially private LLM

VaultGemmaは、差分プライバシーを用いてゼロからトレーニングされた最も能力の高い言語モデルです。AIが私たちの生活にますます統合される中、プライバシーを中心に構築することが重要です。差分プライバシーは、記憶を防ぐために調整されたノイズを追加することで、数学的に堅牢な解決策を提供しますが、LLMに適用する際にはトレードオフが生じます。これにより、トレーニングの安定性が低下し、バッチサイズと計算コストが大幅に増加します。新しい研究「差分プライバシー言語モデルのスケーリング法則」では、これらの複雑さを正確にモデル化する法則を確立しました。VaultGemmaは、1Bパラメータを持つオープンモデルで、Hugging FaceとKaggleで重みを公開し、プライベートAIの次世代開発を促進します。 • VaultGemmaは差分プライバシーを用いてトレーニングされた最も能力の高いLLMである。 • 差分プライバシーは、記憶を防ぐためにノイズを追加することでプライバシーを保護する。 • LLMにおける差分プライバシーの適用にはトレードオフがあり、トレーニングの安定性が低下する。 • 新しい研究により、計算、プライバシー、データの予算に基づく最適なトレーニング構成を導き出すことができる。 • VaultGemmaは1Bパラメータを持ち、Hugging FaceとKaggleで重みが公開されている。

Google Research
platform
No Image

Comparing the memory implementations of Claude and ChatGPT

Shlok Khemani has been doing excellent work reverse-engineering LLM systems and documenting his discoveries. Last week he wrote about ChatGPT memory. This week it's Claude. Claude's memory system has two …

Simon Willison's Blog
api tool
Announcing OpenAI Grove

Announcing OpenAI Grove

A program for individuals early in their company building journey.

OpenAI Blog
tool
Qwen3-Next-80B-A3B: 🐧🦩 Who needs legs?!

Qwen3-Next-80B-A3B: 🐧🦩 Who needs legs?!

Qwen announced two new models via their Twitter account (nothing on their blog yet): Qwen3-Next-80B-A3B-Instruct and Qwen3-Next-80B-A3B-Thinking. They make some big claims on performance: Qwen3-Next-80B-A3B-Instruct approaches our 235B flagship. Qwen3-Next-80B-A3B-Thinking …

Simon Willison's Blog
tool
1.0.21

1.0.21

この記事は、Chromaのバージョン1.0.21のリリースノートを提供しています。このリリースでは、いくつかの重要な改善点が含まれています。具体的には、NACキューへのキャンセルの伝播、ユーザーIDを返す認証フックの更新、距離計算に対するAVX512サポートの追加、CLI接続文字列の更新、Pythonクライアントへの新機能の追加などが行われました。また、ガーベジコレクタのメモリ使用量の削減や、DockerHubログインのスキップなどの改善も含まれています。バグ修正やテストの改善も行われており、全体としてパフォーマンスの向上が図られています。 • NACキューへのキャンセルの伝播を実装 • ユーザーIDを返す認証フックの更新 • 距離計算にAVX512サポートを追加 • CLI接続文字列の更新 • Pythonクライアントに新機能を追加 • ガーベジコレクタのメモリ使用量を削減 • DockerHubログインをCIでスキップする機能を追加 • バグ修正やテストの改善を実施

chroma-core/chroma
release tool
Speculative cascades — A hybrid approach for smarter, faster LLM inference

Speculative cascades — A hybrid approach for smarter, faster LLM inference

この記事では、「スペキュレイティブカスケード」という新しいアプローチを紹介し、LLM(大規模言語モデル)の効率と計算コストを改善する方法を提案しています。この手法は、標準的なカスケードとスペキュレイティブデコーディングを組み合わせたもので、LLMの応答生成プロセスを迅速化し、コストを削減することを目指しています。カスケードは、小型の高速モデルを使用して、より大きく高価なモデルにタスクを渡すかどうかを判断することで、効率的なリソース配分を実現します。一方、スペキュレイティブデコーディングは、より小型のモデルが未来のトークンを予測し、それを大きなモデルで検証することで、応答生成の速度を向上させます。スペキュレイティブカスケードは、これらの手法の利点を組み合わせ、コストと品質のトレードオフを改善し、さまざまな言語タスクにおいて優れた結果を示しました。 • LLMの応答生成の効率とコストを改善する新しいアプローチ「スペキュレイティブカスケード」を提案 • カスケードは小型モデルを使用してコストを削減し、大型モデルにタスクを渡すか判断する • スペキュレイティブデコーディングは小型モデルが未来のトークンを予測し、大型モデルで検証する • スペキュレイティブカスケードは、コストと品質のトレードオフを改善し、より良い結果を提供 • GemmaとT5モデルを使用した実験で、標準的なカスケードやスペキュレイティブデコーディングと比較して優れた結果を示した

Google Research
api cloud tool
Release v3.28.1

Release v3.28.1

Roo Codeのリリースv3.28.1では、いくつかの新機能と修正が発表されました。新たにRoo Code Cloudを開くためのタスクボタンが追加され、Posthogのテレメトリーがデフォルトとして設定されました。また、チェックポイントの初期化に失敗した際に通知が表示されるようになりました。生成された画像プレビューのキャッシュをクリアする機能も追加され、セレクタードロップダウンのアクティブモードが中央に配置されるよう修正されました。会話の圧縮中に最初のメッセージを保持するバグも修正されました。 • Roo Code Cloudを開くためのタスクボタンが追加された。 • Posthogのテレメトリーがデフォルト設定となった。 • チェックポイントの初期化失敗時に通知が表示されるようになった。 • 生成された画像プレビューのキャッシュをクリアする機能が追加された。 • セレクタードロップダウンのアクティブモードが中央に配置されるよう修正された。 • 会話の圧縮中に最初のメッセージを保持するバグが修正された。

RooCodeInc/Roo-Code
release tool
cli-1.1.9

cli-1.1.9

この記事は、GitHub上でのchroma-coreプロジェクトのCLIバージョン1.1.9のリリースに関する情報を提供しています。このリリースは2023年9月11日に行われ、特定のコミット(482f4a7)が作成され、GitHubの検証済み署名で署名されています。リリースには6つのアセットが含まれていることが示されていますが、詳細な内容や変更点については記載されていません。ユーザーは、GitHubのインターフェースを通じてリリース情報を確認することができます。 • CLIバージョン1.1.9が2023年9月11日にリリースされた • リリースは特定のコミット(482f4a7)に基づいている • GitHubの検証済み署名で署名されている • リリースには6つのアセットが含まれている • 詳細な変更点や新機能については記載がない

chroma-core/chroma
release tool
langchain-prompty==0.1.2

langchain-prompty==0.1.2

この記事は、langchain-promptyのバージョン0.1.2のリリースに関するもので、主に変更点や改善点が記載されています。リリース日付は2023年9月11日で、主な変更には、pytest-asyncioの非推奨警告への対処、ドキュメントの改善、コードベース全体のフォーマット、ruffのルール追加と修正が含まれています。また、Makefileのターゲット修正や、OpenAIに関するドキュメントの充実も行われています。これらの変更は、開発者体験の向上やコードの整合性を保つことを目的としています。 • langchain-promptyのバージョン0.1.2がリリースされた • pytest-asyncioの非推奨警告に対処した • ドキュメントの改善が行われた • コードベース全体のフォーマットが整えられた • ruffのルールが追加され、修正が行われた • Makefileのターゲットが修正された • OpenAIに関するドキュメントが充実した

langchain-ai/langchain
release tool
langchain-nomic==0.1.5

langchain-nomic==0.1.5

この記事は、langchain-nomicのバージョン0.1.5のリリースに関するもので、主に変更点や修正内容が記載されています。主な変更点には、ruffのターゲットバージョンの削除、pytest-asyncioの非推奨警告への対処、ドキュメントの改善、Unicodeレスポンスの修正、linterのルール追加などが含まれています。また、Pythonの上限バージョンの削除や、依存関係のクリーンアップ、CIの速度向上に関する変更も行われています。これらの変更は、開発者の体験を向上させることを目的としています。 • langchain-nomicのバージョン0.1.5がリリースされた • ruffのターゲットバージョンが削除された • pytest-asyncioの非推奨警告に対処した • ドキュメントが改善され、具体的な例が追加された • Unicodeレスポンスの修正が行われた • linterにruffのルールが追加された • Pythonの上限バージョンが削除された • 依存関係のクリーンアップが行われ、CIの速度が向上した

langchain-ai/langchain
release tool
langchain-ollama==0.3.8

langchain-ollama==0.3.8

この記事は、GitHub上で公開されたlangchain-ollamaのバージョン0.3.8のリリースに関する情報を提供しています。このリリースは2023年9月11日に行われ、主な変更点として、メッセージコンテンツリストの処理に関する修正や、ドキュメントの標準化が含まれています。また、pytest-asyncioの非推奨警告に対処するための作業も行われています。これにより、開発者はより安定した環境で作業できるようになります。 • langchain-ollamaのバージョン0.3.8がリリースされた • メッセージコンテンツリストの処理に関するバグが修正された • ドキュメントの標準化が行われた • pytest-asyncioの非推奨警告に対処した • リリース日は2023年9月11日である

langchain-ai/langchain
library release
langchain-exa==0.3.1

langchain-exa==0.3.1

この記事は、langchain-exaのバージョン0.3.1のリリースに関するもので、主に変更点や修正内容が記載されています。リリース日は2023年9月11日で、主な変更には、ruffのターゲットバージョンの削除、pytest-asyncioの非推奨警告への対処、ドキュメントの改善、Unicodeレスポンスの修正などが含まれています。また、Makefileのターゲットの修正や、ruffのルールの追加・修正も行われています。これにより、開発者体験が向上し、コードの品質が改善されることが期待されます。 • langchain-exaのバージョン0.3.1がリリースされた • ruffのターゲットバージョンが削除された • pytest-asyncioの非推奨警告に対処した • ドキュメントが改善され、extra_bodyの例が追加された • Unicodeレスポンスの修正が行われた • Makefileのターゲットが修正された • ruffのルールが追加・修正され、コードの品質が向上した

langchain-ai/langchain
release tool
langchain-chroma==0.2.6

langchain-chroma==0.2.6

この記事は、langchain-chromaのバージョン0.2.6のリリースに関するもので、主に以下の変更点が含まれています。まず、chromaにおいてコレクションフォークのサポートが追加されました。また、pytest-asyncioの非推奨警告に対処し、ドキュメントのビルドに関する修正が行われました。さらに、非ASCII文字の強制Unicode変換によるLLMの模倣に関する問題が修正され、ドキュメントのキャピタリゼーションやコードブロックのフォーマット、ハイパーリンクに関する修正も行われています。これらの変更は、開発者体験の向上を目指しており、Makefileのターゲットも修正されています。 • chromaにコレクションフォークのサポートが追加された • pytest-asyncioの非推奨警告に対処した • ドキュメントビルドの修正が行われた • 非ASCII文字のUnicode変換によるLLMの模倣問題が修正された • ドキュメントのキャピタリゼーションやコードブロックのフォーマット、ハイパーリンクの修正が行われた

langchain-ai/langchain
release tool
langchain-anthropic==0.3.20

langchain-anthropic==0.3.20

この記事は、langchain-anthropicのバージョン0.3.20のリリースに関する情報を提供しています。このリリースでは、主に以下の変更が行われました。新機能として、web fetchのベータ版が追加され、いくつかの不要なベータフラグが削除されました。また、ChatAnthropicモデルのテストおよびドキュメントの更新が行われ、TTLに関するベータヘッダーの警告も削除されました。さらに、pytest-asyncioの非推奨警告に対処するための修正も含まれています。 • 新機能としてweb fetchのベータ版が追加された • 不要なベータフラグが削除された • ChatAnthropicモデルのテストとドキュメントが更新された • TTLに関するベータヘッダーの警告が削除された • pytest-asyncioの非推奨警告に対処する修正が行われた

langchain-ai/langchain
release tool
Enhance video understanding with Amazon Bedrock Data Automation and open-set object detection

Enhance video understanding with Amazon Bedrock Data Automation and open-set object detection

In real-world video and image analysis, businesses often face the challenge of detecting objects that weren’t part of a model’s original training set. This becomes especially difficult in dynamic environments where new, unknown, or user-defined objects frequently appear. In this post, we explore how Amazon Bedrock Data Automation uses OSOD to enhance video understanding.

AWS Machine Learning Blog
api tool
How Skello uses Amazon Bedrock to query data in a multi-tenant environment while keeping logical boundaries

How Skello uses Amazon Bedrock to query data in a multi-tenant environment while keeping logical boundaries

Skello is a leading human resources (HR) software as a service (SaaS) solution focusing on employee scheduling and workforce management. Catering to diverse sectors such as hospitality, retail, healthcare, construction, and industry, Skello offers features including schedule creation, time tracking, and payroll preparation. We dive deep into the challenges of implementing large language models (LLMs) for data querying, particularly in the context of a French company operating under the General Data Protection Regulation (GDPR).

AWS Machine Learning Blog
api tool
Create a private workforce on Amazon SageMaker Ground Truth with the AWS CDK

Create a private workforce on Amazon SageMaker Ground Truth with the AWS CDK

In this post, we present a complete solution for programmatically creating private workforces on Amazon SageMaker AI using the AWS Cloud Development Kit (AWS CDK), including the setup of a dedicated, fully configured Amazon Cognito user pool.

AWS Machine Learning Blog
api tool
Smarter nucleic acid design with NucleoBench and AdaBeam

Smarter nucleic acid design with NucleoBench and AdaBeam

本記事では、NucleoBenchとAdaBeamという新しいアルゴリズムを用いた核酸配列設計のためのオープンソースソフトウェアベンチマークについて説明しています。核酸の設計は、特定の治療特性を持つDNAやRNAの配列を見つけることが重要であり、特にCRISPR遺伝子治療やmRNAワクチンの開発において重要です。NucleoBenchは、16の異なる生物学的課題に対して40万回以上の実験を行い、異なるアルゴリズムの性能を評価するための標準化されたフレームワークを提供します。これにより、AdaBeamというハイブリッド設計アルゴリズムが開発され、既存の手法よりも11のタスクで優れた性能を示しました。AdaBeamは、AIを活用して最適な配列を生成するための新しいアプローチを提供し、今後の生物学におけるAIの発展に寄与することが期待されています。 • 核酸配列設計の重要性と課題を説明 • NucleoBenchは、異なるアルゴリズムの性能を比較するための標準化されたベンチマーク • AdaBeamは、既存の手法よりも11のタスクで優れた性能を示す • AIを活用して最適な配列を生成する新しいアプローチを提供 • 400,000回以上の実験を通じて得られた洞察を基に開発された

Google Research
api tool
August 2025 (version 1.104)

August 2025 (version 1.104)

Learn what is new in the Visual Studio Code August 2025 Release (1.104)

VS Code Blog
api tool
How to turn Claude Code into a domain specific coding agent

How to turn Claude Code into a domain specific coding agent

Authored by: Aliyan Ishfaq Coding agents are great at writing code that uses popular libraries on which LLMs have been heavily trained on. But point them to a custom library, a new version of a library, an internal API, or a niche framework – and they’re not so great. That’

LangChain Blog
library tool
How AI made Meet’s language translation possible

How AI made Meet’s language translation possible

Learn more about Google Meet’s real-time language translation feature.

Google AI Blog
api cloud tool
A joint statement from OpenAI and Microsoft

A joint statement from OpenAI and Microsoft

OpenAI and Microsoft sign a new MOU, reinforcing their partnership and shared commitment to AI safety and innovation.

OpenAI Blog
tool
Statement on OpenAI’s Nonprofit and PBC

Statement on OpenAI’s Nonprofit and PBC

By Bret Taylor

OpenAI Blog
library tool
LongCat-Flash Chat model is now supported in Vercel AI Gateway

LongCat-Flash Chat model is now supported in Vercel AI Gateway

You can now access LongCat-Flash Chat from Meituan using Vercel AI Gateway, with no Meituan account required.

Vercel Blog
api cloud tool
No Image

Defeating Nondeterminism in LLM Inference

A very common question I see about LLMs concerns why they can't be made to deliver the same response to the same prompt by setting a fixed random number seed. …

Simon Willison's Blog
library tool
Monte Carlo: Building Data + AI Observability Agents with LangGraph and LangSmith

Monte Carlo: Building Data + AI Observability Agents with LangGraph and LangSmith

See how Monte Carlo built its AI Troubleshooting Agent on LangGraph and debugged with LangSmith to help data teams resolve issues faster

LangChain Blog
api tool
Release v3.28.0

Release v3.28.0

Roo Codeのバージョン3.28.0がリリースされ、いくつかの新機能と修正が追加されました。新機能には、Roo Code Cloudでのタスクの継続、リダイレクト処理なしでのクラウド接続のサポート、タスクの同期を制御するトグルの追加、チャットメッセージの編集・キャンセル機能の改善が含まれています。また、いくつかのバグ修正も行われ、特にチャットメッセージの重複問題や、TabbyApi/ExLlamaV2のクラッシュを修正しました。依存関係の更新も行われ、eslint-plugin-turboやesbuildなどが新しいバージョンに更新されています。 • Roo Code Cloudでのタスク継続機能の追加 • リダイレクトなしでのクラウド接続サポート • タスク同期を制御するトグルの追加 • チャットメッセージの編集・キャンセル機能の改善 • チャットメッセージの重複問題の修正 • TabbyApi/ExLlamaV2のクラッシュ修正 • 依存関係の更新(eslint-plugin-turbo、esbuildなど)

RooCodeInc/Roo-Code
release tool
2025-09-10

2025-09-10

この記事は、mastra-aiのリリースに関するもので、2025年9月10日に行われた更新内容を詳述しています。主な変更点には、TypeScriptの依存関係を外部としてマークすることでビルド出力から不要なTypeScriptチャンクを防ぐ修正、AI SDK V5における画像入力の処理の改善、CLIの開発スタートアップコピーの変更、Playground UIのStorybook設定の追加などが含まれています。また、さまざまなバグ修正や機能追加も行われており、特にストリームチャンクの処理やエクスポーターのデフォルトクラウドエンドポイントの設定に関する改善が強調されています。これにより、開発者はより安定した環境で作業できるようになります。 • TypeScriptの依存関係を外部としてマークし、ビルド出力から不要なチャンクを防ぐ修正が行われた。 • AI SDK V5での画像入力処理の改善により、画像URLとbase64データの区別が適切に行われるようになった。 • CLIの開発スタートアップコピーが'Local'から'Playground'に変更された。 • Playground UIのStorybook設定が追加され、開発者の利便性が向上した。 • さまざまなバグ修正が行われ、特にストリームチャンクの処理やエクスポーターのデフォルトクラウドエンドポイントの設定が改善された。

mastra-ai/mastra
library release tool
Moving sales, service, and finance to the Frontier with Microsoft 365 Copilot

Moving sales, service, and finance to the Frontier with Microsoft 365 Copilot

Microsoft is announcing the addition of role-based AI solutions to Microsoft 365 Copilot for sales, service, and finance professionals.

Microsoft AI Blog
api cloud tool
langchain-qdrant==0.2.1

langchain-qdrant==0.2.1

この記事は、langchain-qdrantのバージョン0.2.1のリリースに関するもので、主にいくつかのバグ修正と機能改善が含まれています。特に、SPARSEモードでのembeddingsなしでのas_retrieverの動作を可能にする修正が行われました。また、ドキュメントのフォーマットやハイパーリンクの修正、pytest-asyncioの非推奨警告への対処も含まれています。新たにsimilarity_search_with_score_by_vector()関数がQdrantVectorStoreに追加され、コードの整形やルールの改善も行われました。全体として、パフォーマンスの向上とコードのクリーンアップが図られています。 • SPARSEモードでのas_retrieverの動作を修正 • ドキュメントのフォーマットやハイパーリンクの修正 • similarity_search_with_score_by_vector()関数の追加 • pytest-asyncioの非推奨警告への対処 • コードの整形やルールの改善

langchain-ai/langchain
release tool
No Image

Claude API: Web fetch tool

New in the Claude API: if you pass the web-fetch-2025-09-10 beta header you can add {"type": "web_fetch_20250910", "name": "web_fetch", "max_uses": 5} to your "tools" list and Claude will gain the …

Simon Willison's Blog
api tool
TII Falcon-H1 models now available on Amazon Bedrock Marketplace and Amazon SageMaker JumpStart

TII Falcon-H1 models now available on Amazon Bedrock Marketplace and Amazon SageMaker JumpStart

We are excited to announce the availability of the Technology Innovation Institute (TII)’s Falcon-H1 models on Amazon Bedrock Marketplace and Amazon SageMaker JumpStart. With this launch, developers and data scientists can now use six instruction-tuned Falcon-H1 models (0.5B, 1.5B, 1.5B-Deep, 3B, 7B, and 34B) on AWS, and have access to a comprehensive suite of hybrid architecture models that combine traditional attention mechanisms with State Space Models (SSMs) to deliver exceptional performance with unprecedented efficiency.

AWS Machine Learning Blog
tool
The latest AI news we announced in August

The latest AI news we announced in August

Here are Google’s latest AI updates from August 2025

Google AI Blog
platform tool
Oldcastle accelerates document processing with Amazon Bedrock

Oldcastle accelerates document processing with Amazon Bedrock

This post explores how Oldcastle partnered with AWS to transform their document processing workflow using Amazon Bedrock with Amazon Textract. We discuss how Oldcastle overcame the limitations of their previous OCR solution to automate the processing of hundreds of thousands of POD documents each month, dramatically improving accuracy while reducing manual effort.

AWS Machine Learning Blog
api tool