Introducing gpt-realtime in the API

Introducing gpt-realtime in the API

Join Brad Lightcap, Peter Bakkum, Beichen Li, Liyu Chen, Julianne Roberson, and Srini Gopalan as they introduce and demo our most advanced speech-to-speech model and new API features like MCP, SIP, image input, and more.

YouTube OpenAI
langchain-text-splitters==0.3.10

langchain-text-splitters==0.3.10

この記事は、langchain-text-splittersのバージョン0.3.10のリリースに関するもので、主に以下の変更点が含まれています。まず、langchain-coreのバージョンを引き上げ、最大制約を緩和しました。また、pytest-asyncioの非推奨警告に対処し、ドキュメント内の誤字を修正しました。新機能として、オプションのカスタムヘッダーパターンのサポートが追加され、mypyのバージョンも1.17に引き上げられました。さらに、コードベース全体のフォーマットやドキュメントの改善も行われています。 • langchain-text-splittersのバージョン0.3.10がリリースされた • langchain-coreのバージョンを引き上げ、最大制約を緩和した • pytest-asyncioの非推奨警告に対処した • オプションのカスタムヘッダーパターンのサポートを追加した • mypyのバージョンを1.17に引き上げた • ドキュメント内の誤字を修正した • コードベース全体のフォーマットを改善した

langchain-ai/langchain
release tool
langchain==1.0.0a2

langchain==1.0.0a2

この記事は、LangChainのバージョン1.0.0a2のリリースに関するもので、GitHub上での変更点や新機能について詳述しています。主な変更点には、コアの上限を削除し、テキストスプリッターのバージョンを更新することが含まれています。また、Python 3.9のサポートを終了し、最新のClaude-3.5 Sonnetを使用するように参照を更新しました。新機能としては、create_react_agentの改良やstuff and map reduce chainsの追加が挙げられます。さらに、ドキュメントの更新やテストの修正も行われています。 • LangChainのバージョン1.0.0a2がリリースされた。 • コアの上限を削除し、テキストスプリッターのバージョンを更新。 • Python 3.9のサポートを終了。 • create_react_agentの機能が改良された。 • 新たにstuff and map reduce chainsが追加された。 • Claude-3.5 Sonnetを使用するように参照を更新。 • ドキュメントの更新やテストの修正が行われた。

langchain-ai/langchain
release tool
I tried out Kiro: Here’s what I learned

I tried out Kiro: Here’s what I learned

Check out Kiro, AWS's AI-powered IDE, see what makes it different from other AI coding tools, and explore whether it lives up to the hype.

logrocket-dev
library tool
Navigating the AI bubble, the 10x AI engineer, and the Cloudflare vs. Perplexity data grab

Navigating the AI bubble, the 10x AI engineer, and the Cloudflare vs. Perplexity data grab

Is the AI industry an unsustainable bubble built on burning billions in cash? We break down the AI hype cycle, the tough job market for developers, and whether a crash is on the horizon. In this panel discussion with Josh Goldberg, Paige, Paul, and Noel, we tackle the biggest questions in tech today. * We debate if AI is just another Web3-style hype cycle * Why the "10x AI engineer" is a myth that ignores the reality of software development * The ethical controversy around AI crawlers and data scraping, highlighted by Cloudflare's recent actions Plus, we cover the latest industry news, including Vercel's powerful new AI SDK V5 and what GitHub's leadership shakeup means for the future of developers.

PodRocket
api cloud tool
Introducing gpt-realtime and Realtime API updates

Introducing gpt-realtime and Realtime API updates

We’re releasing a more advanced speech-to-speech model and new API capabilities including MCP server support, image input, and SIP phone calling support.

OpenAI Blog
api tool
Supporting nonprofit and community innovation

Supporting nonprofit and community innovation

$50M People-First AI Fund opens for applications Sept 8–Oct 8, 2025.

OpenAI Blog
tool
The core KPIs of LLM performance (and how to track them)

The core KPIs of LLM performance (and how to track them)

Track the most important LLM metrics: traffic, tokens, cost, latency, and errors. Learn how to set up dashboards and alerts with Sentry.

sentry-blog
api tool
Finetune and deploy GPT-OSS in MXFP4: ModelOpt+SGLang

Finetune and deploy GPT-OSS in MXFP4: ModelOpt+SGLang

<p>GPT-OSS, the first open-source model family from OpenAI's lab since GPT-2, demonstrates strong math, coding, and general capabilities even when compared w...

LMSYS Blog
library tool
langchain-openai==1.0.0a1

langchain-openai==1.0.0a1

この記事は、langchain-openaiのバージョン1.0.0a1のリリースに関する情報を提供しています。このリリースでは、OpenAIおよびAnthropicのサポートが追加され、Python 3.9のサポートが削除されました。また、標準コンテンツ、ID、翻訳者、正規化の機能が追加され、さまざまなバグ修正や機能改善が行われています。具体的には、GPT-5チャットモデルの温度パラメータのサポートや、OpenAIクライアントエラーに対する生のレスポンスオブジェクトの追加が含まれています。ドキュメントの修正やテストの追加も行われ、開発者体験の向上が図られています。 • OpenAIおよびAnthropicのサポートが追加された • Python 3.9のサポートが削除された • 標準コンテンツ、ID、翻訳者、正規化の機能が追加された • GPT-5チャットモデルの温度パラメータのサポートが追加された • OpenAIクライアントエラーに生のレスポンスオブジェクトを追加した • ドキュメントの修正やテストの追加が行われた

langchain-ai/langchain
api release tool
langchain-anthropic==1.0.0a1

langchain-anthropic==1.0.0a1

この記事は、langchain-anthropicのバージョン1.0.0a1のリリースに関するもので、GitHub上での変更点や修正内容が記載されています。主な修正には、OpenAIとAnthropicのサポートの更新、Python 3.9のサポートの削除、AIMessageの返り値の型の更新、ストリーミングベンチマークのためのカセットの更新、トークンカウントの修正などが含まれています。また、Claude-3.5 Sonnetの最新バージョンを使用するための参照の更新や、メッセージAPIを使用するためのAnthropicLLMのリファクタリングも行われています。ドキュメントの改善やテストモデル名の更新も行われており、開発者向けの情報が充実しています。 • langchain-anthropicのバージョン1.0.0a1がリリースされた。 • OpenAIとAnthropicのサポートが更新された。 • Python 3.9のサポートが削除された。 • AIMessageの返り値の型が更新された。 • ストリーミングベンチマークのためのカセットが更新された。 • Claude-3.5 Sonnetの最新バージョンを使用するための参照が更新された。 • メッセージAPIを使用するためのAnthropicLLMのリファクタリングが行われた。 • ドキュメントの改善が行われ、開発者向けの情報が充実した。

langchain-ai/langchain
library release tool
@browserbasehq/stagehand@2.4.4

@browserbasehq/[email protected]

この記事は、GitHub上で公開された@browserbasehq/stagehandのバージョン2.4.4のリリースに関する情報を提供しています。このリリースでは、特にAPIバリデーションを無効にする機能が修正されました。具体的には、カスタムLLMクライアントが提供された場合にAPIバリデーションが無効になる問題が解決されています。リリース日は2023年8月27日で、GitHubの署名付きコミットとして記録されています。 • APIバリデーションを無効にする機能の修正 • カスタムLLMクライアントが提供された場合の問題解決 • リリース日は2023年8月27日 • GitHubの署名付きコミットとして記録されている

browserbase/stagehand
release tool
No Image

Quoting Bruce Schneier

We simply don’t know to defend against these attacks. We have zero agentic AI systems that are secure against these attacks. Any AI that is working in an adversarial environment—and …

Simon Willison's Blog
security
Release v3.26.1

Release v3.26.1

RooCodeIncのRoo-Codeリポジトリのバージョン3.26.1が2025年8月27日にリリースされました。このリリースでは、Vercel AI Gatewayプロバイダーの統合が追加され、Vercelの埋め込み機能がサポートされるようになりました。また、QdrantベクトルとHNSWインデックスのオンディスクストレージが有効化され、API設定のドロップダウンにモデルIDが表示されるようになりました。さらに、VSCodeのツールチップスタイルに合わせたツールチップコンポーネントの更新や、タスクヘッダー内の重複キャッシュ表示の修正、ランダムチャットテキストエリアのクリーンアップが行われました。 • Vercel AI Gatewayプロバイダーの統合が追加された • Vercelの埋め込み機能がサポートされた • QdrantベクトルとHNSWインデックスのオンディスクストレージが有効化された • API設定のドロップダウンにモデルIDが表示されるようになった • VSCodeのツールチップスタイルに合わせたツールチップコンポーネントの更新が行われた • タスクヘッダー内の重複キャッシュ表示が修正された • ランダムチャットテキストエリアのクリーンアップが行われた

RooCodeInc/Roo-Code
api release tool
How Google’s AI can help transform health professions education

How Google’s AI can help transform health professions education

この記事では、GoogleのAIモデルが医療教育においてどのように役立つかを探求しています。特に、医療専門職の教育におけるAIの活用が、2023年までに1100万人以上の医療従事者が不足するという予測に対処する手段として注目されています。2つの研究が紹介されており、1つ目は医療学生とAIチューターを用いた臨床推論のケーススタディで、AIツールが学習者に適応し、建設的なフィードバックを提供する能力が評価されています。2つ目は、LearnLMというGeminiベースのモデルが医療教育シナリオでの効果を定量的に評価したもので、医療教育者から高い評価を得ています。これらの研究は、AIが個別化された学習経路を拡張し、能力に基づくアプローチを補完する可能性を示しています。 • 医療専門職の教育におけるAIの活用が、医療従事者不足の問題に対処する手段として注目されている。 • AIツールは学習者に適応し、建設的なフィードバックを提供する能力が求められている。 • LearnLMはGeminiベースのモデルで、医療教育シナリオにおいて高い評価を得ている。 • 医療学習者のニーズを理解するために、UXリサーチと共同設計ワークショップが実施された。 • AIチューターは、臨床推論を支援するために設計され、学習者の個別の学習スタイルに適応することが期待されている。

Google Research
framework tool
How Google is investing in Virginia to accelerate innovation for the U.S.

How Google is investing in Virginia to accelerate innovation for the U.S.

Google is investing an additional $9 billion in Virginia through 2026 in cloud and AI infrastructure. As we expand our local presence, including a new data center in Che…

Google AI Blog
cloud
Research Preview: Claude for Chrome

Research Preview: Claude for Chrome

YouTube Anthropic
5 ways to use Copilot and AI tools to spark curiosity this school year

5 ways to use Copilot and AI tools to spark curiosity this school year

Discover ways to use Copilot Chat and AI tools for success this school year—support learning outcomes and streamline your daily tasks.

Microsoft AI Blog
api tool
Mercury foundation models from Inception Labs are now available in Amazon Bedrock Marketplace and Amazon SageMaker JumpStart

Mercury foundation models from Inception Labs are now available in Amazon Bedrock Marketplace and Amazon SageMaker JumpStart

In this post, we announce that Mercury and Mercury Coder foundation models from Inception Labs are now available through Amazon Bedrock Marketplace and Amazon SageMaker JumpStart. We demonstrate how to deploy these ultra-fast diffusion-based language models that can generate up to 1,100 tokens per second on NVIDIA H100 GPUs, and showcase their capabilities in code generation and tool use scenarios.

AWS Machine Learning Blog
api cloud tool
2025-08-27

2025-08-27

2025年8月27日にリリースされたMastraの新バージョンでは、Zod v4のサポートが追加され、Zod v3との互換性も維持されています。新たにai-tracingという名称で観測機能が強化され、streamVNextおよびgenerateVNextメソッドの改善が行われました。PATCH HTTPメソッドのカスタムAPIルートへのサポートが追加され、関連するテストも更新されています。クライアントSDKには、fetchリクエストにおける'credentials'オプションが追加され、ユーザーがクッキーや認証ヘッダーの動作を制御できるようになりました。また、AIトレースの取得用APIや、AIスパンをLibsqlに保存するための新しいAPIも導入されています。 • Zod v4のサポート追加、Zod v3との互換性維持 • ai-tracingという名称で観測機能を強化 • PATCH HTTPメソッドのカスタムAPIルートへのサポート追加 • クライアントSDKに'credentials'オプションを追加 • AIトレース取得用APIの導入 • AIスパンをLibsqlに保存するための新APIの追加

mastra-ai/mastra
api release tool
How to protect your AI agent from prompt injection attacks

How to protect your AI agent from prompt injection attacks

Explore six principled design patterns (with real-world examples) to help you protect your LLM agents from prompt injection attacks.

logrocket-dev
security tool
Collective alignment: public input on our Model Spec

Collective alignment: public input on our Model Spec

We surveyed over 1,000 people worldwide on how our models should behave and compared their views to our Model Spec. We found they largely agree with the Spec, and we adopted changes from the disagreements.

OpenAI Blog
library tool
Build Slack agents with @vercel/slack-bolt

Build Slack agents with @vercel/slack-bolt

Deploy your Slack agent to Vercel's AI Cloud using @vercel/slack-bolt to take advantage of AI Gateway, Fluid compute, and more.

Vercel Blog
api tool
OpenAI and Anthropic share findings from a joint safety evaluation

OpenAI and Anthropic share findings from a joint safety evaluation

OpenAI and Anthropic share findings from a first-of-its-kind joint safety evaluation, testing each other’s models for misalignment, instruction following, hallucinations, jailbreaking, and more—highlighting progress, challenges, and the value of cross-lab collaboration.

OpenAI Blog
tool
Threat Intelligence: How Anthropic stops AI cybercrime

Threat Intelligence: How Anthropic stops AI cybercrime

AI helps people work more efficiently. Unfortunately, this also applies to criminals. We've discovered that our own AI models are being used in sophisticated cybercrime operations, including a large-scale fraud scheme run by North Korea. What is Anthropic doing to detect and prevent AI cybercrime? How exactly are criminals using large language models to scam their victims? And what is "vibe hacking"? In this video, Anthropic's Jacob Klein and Alex Moix answer all these questions and more, discussing their work disrupting AI cybercrime and their new Threat Intelligence report. Read the Threat Intelligence report: https://www.anthropic.com/news/detecting-countering-misuse-aug-2025 Sections: Introduction [00:00] "Vibe hacking" [01:49] Our response to abuses of our models [08:34] North Korea's employment scam [15:02] Ransomware, romance scams, and other abuses [23:50] How concerned should we be? [31:46]

YouTube Anthropic
SGLang for gpt-oss: From Day 0 Support to Enhanced Performance

SGLang for gpt-oss: From Day 0 Support to Enhanced Performance

<p>We are excited to announce a major update for SGLang, focusing on deep performance optimizations and new features for the recently released openai/gpt-oss...

LMSYS Blog
library tool
No Image

Piloting Claude for Chrome

Two days ago I said: I strongly expect that the entire concept of an agentic browser extension is fatally flawed and cannot be built safely. Today Anthropic announced their own …

Simon Willison's Blog
api security tool
Release v3.26.0

Release v3.26.0

RooCodeIncのリリースv3.26.0では、いくつかの新機能と修正が追加されました。新機能として、Qwen Code CLI APIのOAuth認証サポートが追加され、Deepseek v3.1がFireworks AIプロバイダーに統合されました。また、/initスラッシュコマンドが組み込まれ、ユーザー入力の選択肢を保持する修正や、Mistralの思考コンテンツを推論チャンクとして処理する修正が行われました。さらに、モデルリストのリクエストに関する問題が解決され、静的プロバイダーのモデルがない場合はリストから非表示にされるようになりました。新しいタスクツールの使用にtodosパラメータが追加され、コマンド検証における置換パターンの処理も改善されました。 • 新機能としてQwen Code CLI APIのOAuth認証サポートが追加された • Deepseek v3.1がFireworks AIプロバイダーに統合された • /initスラッシュコマンドが新たに追加された • ユーザー入力の選択肢を保持する修正が行われた • Mistralの思考コンテンツを推論チャンクとして処理する修正が行われた • モデルリストのリクエストに関する問題が解決された • 静的プロバイダーのモデルがない場合はリストから非表示にされるようになった • 新しいタスクツールの使用にtodosパラメータが追加された

RooCodeInc/Roo-Code
api release tool
No Image

A Primer on LLM Post-Training

この記事では、大規模言語モデル(LLM)のポストトレーニングについて解説しています。ポストトレーニングは、モデルが人間の好む方法で応答し、推論する能力を教える重要なプロセスです。これは、ユーザーとの会話を行うための基本的なルールをモデルに教えるもので、事前トレーニングとは異なり、構造化されていないデータを使用して次の単語を予測するだけではありません。ポストトレーニングでは、システムプロンプトや監視付きファインチューニングを通じて、モデルに優先される基本ルールを課すことができます。また、ポストトレーニングのデータフォーマットについても説明されており、ユーザーとの対話がどのように行われるかが示されています。 • ポストトレーニングは、LLMが人間の好む応答をするための重要なプロセスである。 • ポストトレーニングは、ユーザーとの会話における基本的なルールをモデルに教える。 • 事前トレーニングは次の単語を予測するだけで、構造化されていないデータを使用する。 • ポストトレーニングでは、システムプロンプトや監視付きファインチューニングを使用して基本ルールを課す。 • ポストトレーニングのデータフォーマットにより、ユーザーとの対話が可能になる。

PyTorch Blog
api tool
Learn how Amazon Health Services improved discovery in Amazon search using AWS ML and gen AI

Learn how Amazon Health Services improved discovery in Amazon search using AWS ML and gen AI

In this post, we show you how Amazon Health Services (AHS) solved discoverability challenges on Amazon.com search using AWS services such as Amazon SageMaker, Amazon Bedrock, and Amazon EMR. By combining machine learning (ML), natural language processing, and vector search capabilities, we improved our ability to connect customers with relevant healthcare offerings.

AWS Machine Learning Blog
api cloud tool
User agent strings to HTTP signatures - methods for AI agent identification

User agent strings to HTTP signatures - methods for AI agent identification

How to verify AI agent identity using HTTP message signatures with TypeScript.

arcjet-blog
api security tool
Tips for getting the best image generation and editing in the Gemini app

Tips for getting the best image generation and editing in the Gemini app

Here are some tips for writing more effective prompts for image generation and editing in Gemini.

Google AI Blog
tool
New AI-powered live translation and language learning tools in Google Translate

New AI-powered live translation and language learning tools in Google Translate

Google Translate is using AI to make live translation and language learning even more helpful.

Google AI Blog
api tool
langchain-core==0.3.75

langchain-core==0.3.75

この記事は、Langchainのコアライブラリのバージョン0.3.75のリリースに関するもので、主な変更点や新機能について説明しています。新機能として、エラー時にレスポンスボディをトレースする機能が追加され、ツールコールに関する後方互換性についての注意が文書に追加されました。また、ドキュメントの誤字修正や、mypyのpydanticプラグインの追加、_StreamingCallbackHandlerのダックタイピングの使用、引数がないツールのデフォルト引数を空の辞書に設定する修正なども行われました。README.mdの内容も更新され、コードベース全体のフォーマットが整えられました。 • エラー時にレスポンスボディをトレースする機能の追加 • ツールコールに関する後方互換性の注意点の追加 • ドキュメントの誤字修正 • mypyのpydanticプラグインの追加 • _StreamingCallbackHandlerのダックタイピングの使用 • 引数がないツールのデフォルト引数を空の辞書に設定する修正 • README.mdの内容の更新 • コードベース全体のフォーマットの整備

langchain-ai/langchain
library release
Transforming scientific discovery with Microsoft Azure and NVIDIA

Transforming scientific discovery with Microsoft Azure and NVIDIA

Microsoft Azure and NVIDIA bring high-performance computing to science, enabling faster simulations and deeper insights. Learn more.

Microsoft AI Blog
cloud tool
langchain-openai==0.3.32

langchain-openai==0.3.32

この記事は、GitHub上でのlangchain-openaiライブラリのバージョン0.3.32のリリースに関する情報を提供しています。このリリースでは、OpenAIクライアントのエラーに対して常に生のレスポンスオブジェクトを追加する修正が行われました。また、ドキュメント内の誤字も修正されています。これにより、ユーザーはエラーの詳細をより明確に把握できるようになります。 • OpenAIクライアントのエラーに生のレスポンスオブジェクトを追加する修正が行われた • ドキュメント内の誤字が修正された • ユーザーはエラーの詳細をより明確に把握できるようになる

langchain-ai/langchain
api library release
cli==0.4.0

cli==0.4.0

この記事は、GitHub上でのlangchain-ai/langgraphリポジトリにおけるcli==0.4.0のリリースについて説明しています。このリリースは2023年8月26日に行われ、前のバージョンであるcli==0.3.8からの変更点が含まれています。具体的な変更内容や新機能については記載されていませんが、リリースノートには新しいアセットが2つ追加されていることが示されています。リリースはGitHubの署名付きで行われており、ユーザーは通知設定を変更するためにサインインする必要があります。 • cli==0.4.0のリリース日が2023年8月26日であること • 前のバージョンcli==0.3.8からの変更点があること • 新しいアセットが2つ追加されたこと • リリースはGitHubの署名付きで行われていること • ユーザーは通知設定を変更するためにサインインが必要であること

langchain-ai/langgraph
release tool
Image editing in Gemini just got a major upgrade

Image editing in Gemini just got a major upgrade

Transform images in amazing new ways with updated native image editing in the Gemini app.

DeepMind Blog
tool ui
Qwen3-Coder: Is this Agentic CLI smarter than senior devs?

Qwen3-Coder: Is this Agentic CLI smarter than senior devs?

Discover Qwen3-Coder, Alibaba’s 480B parameter agentic coding CLI, with real-world tests, use cases, and performance insights.

logrocket-dev
api library tool
A scalable framework for evaluating health language models

A scalable framework for evaluating health language models

本記事では、健康分野における言語モデルの評価のための新しい適応型評価フレームワークを提案しています。従来の評価方法は人間の専門家に依存しており、コストが高く、労力がかかり、スケーラブルではありません。提案されたフレームワークは、複雑な評価質問を単純な二項応答(はい/いいえ)に分解することで、評価の一貫性と効率を向上させることを目的としています。具体的には、適応型精密ブールルブリックを導入し、健康データを考慮した評価を行います。この方法は、メタボリックヘルスの領域で検証され、ユーザーの健康情報に基づくパーソナライズされた応答の精度を高めることが期待されています。 • 健康分野における言語モデルの評価は高コストで労力がかかる。 • 新しい適応型評価フレームワークを提案し、評価の効率と一貫性を向上させる。 • 複雑な評価質問を単純な二項応答に分解することで、評価の精度を高める。 • 適応型精密ブールルブリックを導入し、健康データを考慮した評価を行う。 • メタボリックヘルスの領域での検証を行い、パーソナライズされた応答の精度向上を目指す。

Google Research
api framework tool
Helping people when they need it most

Helping people when they need it most

How we think about safety for users experiencing mental or emotional distress, the limits of today’s systems, and the work underway to refine them.

OpenAI Blog
tool
No Image

Will Smith’s concert crowds are real, but AI is blurring the lines

Great piece from Andy Baio demonstrating quite how convoluted the usage ethics and backlash against generative AI has become. Will Smith has been accused of using AI to misleadingly inflate …

Simon Willison's Blog
platform
VS Code Dev Days – Join an event near you to learn about AI-assisted development

VS Code Dev Days – Join an event near you to learn about AI-assisted development

Join a VS Code Dev Days event to learn about GitHub Copilot in VS Code

VS Code Blog
api cloud tool
Announcing Mastra's improved agent orchestration with AI SDK v5 support

Announcing Mastra's improved agent orchestration with AI SDK v5 support

Mastra now controls the agent loop and tool calling with increased orchestration capabilities—while maintaining backward compatibility with AI SDK v4 and v5.

Mastra Blog
ai api framework
NotebookLM's Video Overviews are now available in 80 languages

NotebookLM's Video Overviews are now available in 80 languages

Learn more about updates to NotebookLM’s Audio and Video Overview tools.

Google AI Blog
api tool
FYAI: Explore the Microsoft AI for Good Lab with Juan M. Lavista Ferres

FYAI: Explore the Microsoft AI for Good Lab with Juan M. Lavista Ferres

Juan M. Lavista Ferres leads Microsoft’s AI for Good Lab, using AI and global partnerships to solve urgent societal challenges. Learn more.

Microsoft AI Blog
platform
No Image

Agentic Browser Security: Indirect Prompt Injection in Perplexity Comet

The security team from Brave took a look at Comet, the LLM-powered "agentic browser" extension from Perplexity, and unsurprisingly found security holes you can drive a truck through. The vulnerability …

Simon Willison's Blog
api security tool
Announcing the OpenAI Learning Accelerator

Announcing the OpenAI Learning Accelerator

OpenAI announces the launch of OpenAI Learning Accelerator, an initiative that aims to bring advanced AI to India’s educators and millions of learners nationwide through accelerated AI research, training, and deployment.

OpenAI Blog
tool
🥇Top AI Papers of the Week

🥇Top AI Papers of the Week

The Top AI Papers of the Week (August 18-24)

Elvis Saravia's NLP Blog
platform
🤖 Agents Weekly: DeepSeek-V3.1, AGENTS.md, URL Context, Context Engineering Tips, Qwen-Image-Edit

🤖 Agents Weekly: DeepSeek-V3.1, AGENTS.md, URL Context, Context Engineering Tips, Qwen-Image-Edit

DeepSeek-V3.1, AGENTS.md, URL Context, Context Engineering Tips, Qwen-Image-Edit

Elvis Saravia's NLP Blog
api tool
No Image

ChatGPT release notes: Project-only memory

The feature I've most wanted from ChatGPT's memory feature (the newer version of memory that automatically includes relevant details from summarized prior conversations) just landed: With project-only memory enabled, ChatGPT …

Simon Willison's Blog
platform
DeepSeek 3.1

DeepSeek 3.1

The latest model from DeepSeek, a 685B monster (like DeepSeek v3 before it) but this time it's a hybrid reasoning model. DeepSeek claim: DeepSeek-V3.1-Think achieves comparable answer quality to DeepSeek-R1-0528, …

Simon Willison's Blog
platform
No Image

Quoting The Bluesky Team

Mississippi's approach would fundamentally change how users access Bluesky. The Supreme Court’s recent decision leaves us facing a hard reality: comply with Mississippi’s age assurance law—and make every Mississippi Bluesky …

Simon Willison's Blog
security
Release v3.25.23

Release v3.25.23

RooCodeIncのGitHubリポジトリで公開されたリリースv3.25.23では、RequestyプロバイダーにカスタムベースURLサポートが追加され、Chutes AIプロバイダーにDeepSeek V3.1モデルが追加されました。また、.roo/modesディレクトリから複数のファイルを読み込む機能が一時的に無効化され、モードのインストールに関するバグが修正されました。これにより、ユーザーは新しい機能を利用できるようになり、バグ修正によって安定性が向上しました。 • RequestyプロバイダーにカスタムベースURLサポートが追加された • Chutes AIプロバイダーにDeepSeek V3.1モデルが追加された • 複数のファイルを読み込む機能が一時的に無効化された • バグ修正によりモードのインストールが安定した

RooCodeInc/Roo-Code
api release tool
langchain-ollama==0.3.7

langchain-ollama==0.3.7

この記事は、langchain-ollamaのバージョン0.3.7のリリースに関するもので、主にいくつかの修正と新機能の追加が含まれています。具体的には、ollama CIの修正、カスタム強度レベルをサポートするための推論タイプの更新、ドキュメントの改善、Makefileターゲットの修正、Unicode変換に関する問題の修正が行われました。また、ドキュメント内のフォーマットやハイパーリンクの修正も含まれています。これにより、開発者体験が向上し、より使いやすいライブラリとなることが期待されます。 • ollama CIの修正が行われた • カスタム強度レベルをサポートするための推論タイプが更新された • ドキュメントの改善が行われた • Makefileターゲットの修正が行われた • Unicode変換に関する問題が修正された

langchain-ai/langchain
release tool
Agentic AI for 5x less: Why Kimi K2 is a frontend game-changer

Agentic AI for 5x less: Why Kimi K2 is a frontend game-changer

Discover how to integrate Kimi K2 agentic mode into a frontend application, and learn how it compares to DeepSeek.

logrocket-dev
api library tool
AI breakthroughs are transforming industries, from healthcare to finance

AI breakthroughs are transforming industries, from healthcare to finance

Remarks from Ruth Porat, President and Chief Investment Officer, Alphabet and Google at the Jackson Hole Economic Symposium.

Google AI Blog
platform
Enhance Geospatial Analysis and GIS Workflows with Amazon Bedrock Capabilities

Enhance Geospatial Analysis and GIS Workflows with Amazon Bedrock Capabilities

Applying emerging technologies to the geospatial domain offers a unique opportunity to create transformative user experiences and intuitive workstreams for users and organizations to deliver on their missions and responsibilities. In this post, we explore how you can integrate existing systems with Amazon Bedrock to create new workflows to unlock efficiencies insights. This integration can benefit technical, nontechnical, and leadership roles alike.

AWS Machine Learning Blog
api tool
Beyond the basics: A comprehensive foundation model selection framework for generative AI

Beyond the basics: A comprehensive foundation model selection framework for generative AI

As the model landscape expands, organizations face complex scenarios when selecting the right foundation model for their applications. In this blog post we present a systematic evaluation methodology for Amazon Bedrock users, combining theoretical frameworks with practical implementation strategies that empower data scientists and machine learning (ML) engineers to make optimal model selections.

AWS Machine Learning Blog
api cloud
No Image

too many model context protocol servers and LLM allocations on the dance floor

Useful reminder from Geoffrey Huntley of the infrequently discussed significant token cost of using MCP. Geoffrey estimate estimates that the usable context window something like Amp or Cursor is around …

Simon Willison's Blog
api tool
Accelerate intelligent document processing with generative AI on AWS

Accelerate intelligent document processing with generative AI on AWS

In this post, we introduce our open source GenAI IDP Accelerator—a tested solution that we use to help customers across industries address their document processing challenges. Automated document processing workflows accurately extract structured information from documents, reducing manual effort. We will show you how this ready-to-deploy solution can help you build those workflows with generative AI on AWS in days instead of months.

AWS Machine Learning Blog
api tool
Amazon SageMaker HyperPod enhances ML infrastructure with scalability and customizability

Amazon SageMaker HyperPod enhances ML infrastructure with scalability and customizability

In this post, we introduced three features in SageMaker HyperPod that enhance scalability and customizability for ML infrastructure. Continuous provisioning offers flexible resource provisioning to help you start training and deploying your models faster and manage your cluster more efficiently. With custom AMIs, you can align your ML environments with organizational security standards and software requirements.

AWS Machine Learning Blog
cloud tool
Release v3.25.22

Release v3.25.22

この記事は、RooCodeIncのGitHubリポジトリにおけるリリースv3.25.22についての情報を提供しています。このリリースは2025年8月22日に行われ、主な変更点としてKimi K2に対するプロンプトキャッシングのサポートが追加されました。また、UIにおけるグローバルカスタムインストラクションに関するドキュメントリンクも追加されています。これらの変更は、ユーザーの利便性を向上させることを目的としています。 • Kimi K2に対するプロンプトキャッシングのサポートが追加された。 • UIにグローバルカスタムインストラクションのドキュメントリンクが追加された。 • リリース日は2025年8月22日である。 • このリリースはユーザーの利便性を向上させることを目的としている。

RooCodeInc/Roo-Code
release tool
No Image

DRAMA Model Inference Efficiency Boosted by 1.7x-2.3x

DRAMAモデルの推論効率が1.7倍から2.3倍向上したことが報告されており、特に可変長シーケンスにおいてLLMベースのエンコーダーとしての生産準備が整った。DRAMAは、プルーニングされたLLaMAバックボーンを活用した密な検索モデルであり、さまざまなバージョンで良好なパフォーマンスを示している。特にDRAMA-baseは、コンパクトなサイズにもかかわらず、英語および多言語の検索タスクで強力なパフォーマンスを発揮する。しかし、実装にかかる高コストが普及の障壁となっていた。これを解決するために、ネストされたテンソル(NJT)を使用してモデルを最適化し、推論効率を大幅に改善した。NJTは、可変長シーケンスデータを効率的に処理するためのPyTorchのサブクラスであり、パディングの無駄を避けることができる。 • DRAMAモデルの推論効率が1.7倍から2.3倍向上した。 • NJT(ネストされたジャグドテンソル)を使用してモデルを最適化した。 • DRAMAはLLaMAバックボーンを活用した密な検索モデルである。 • DRAMA-baseはコンパクトなサイズでありながら、英語および多言語の検索タスクで強力なパフォーマンスを示す。 • NJTは可変長シーケンスデータを効率的に処理し、パディングの無駄を避ける。

PyTorch Blog
library tool
# Patch v4.55.4

# Patch v4.55.4

この記事は、Hugging FaceのTransformersライブラリのバージョン4.55.4のパッチリリースについて説明しています。このパッチは、コミット#40197のチェリーピックに関する問題を修正するための公式な修正です。リリースは2023年8月22日に行われ、これまでにメインブランチに252のコミットが追加されています。記事では、リリースに関する詳細や修正内容についての情報が提供されています。 • コミット#40197のチェリーピックに関する問題が発生した • パッチv4.55.4はその問題を修正するための公式なリリースである • リリース日は2023年8月22日である • メインブランチにはこれまでに252のコミットが追加されている

huggingface/transformers
release tool
Accelerating life sciences research

Accelerating life sciences research

OpenAI and Retro Biosciences achieve 50x increase in expressing stem cell reprogramming markers.

OpenAI Blog
tool
Release v3.25.21

Release v3.25.21

RooCodeIncのGitHubリポジトリで公開されたリリースv3.25.21では、いくつかの重要な改善が行われた。主な変更点には、OpenAIのResponses APIにおいてGPT-5にサブタスクの結果を提供する機能の追加、実験的なAssistantMessageParserをデフォルトのパーサーとして昇格させること、DeepSeekモデルのコンテキストウィンドウを128kに更新することが含まれる。また、Vertex AIのためのグラウンディング機能の有効化、オーケストレーターがサブタスクにTODOリストを渡すことを可能にする機能の追加、MDM処理の改善、OpenAIおよび他のプロバイダーに対するコンテキストウィンドウのエラーハンドリングの改善なども行われた。さらに、Roo Marketplaceに「インストール済み」フィルターを追加し、複数のYAMLファイルからRooモードを読み込むサポートも強化された。 • OpenAIのResponses APIにGPT-5にサブタスク結果を提供する機能を追加 • AssistantMessageParserをデフォルトのパーサーとして昇格 • DeepSeekモデルのコンテキストウィンドウを128kに更新 • Vertex AIのためのグラウンディング機能を有効化 • オーケストレーターがサブタスクにTODOリストを渡す機能を追加 • MDM処理の改善 • OpenAIおよび他のプロバイダーに対するコンテキストウィンドウのエラーハンドリングを改善 • Roo Marketplaceに「インストール済み」フィルターを追加 • 複数のYAMLファイルからRooモードを読み込むサポートを強化

RooCodeInc/Roo-Code
release tool
sdk==0.2.3

sdk==0.2.3

この記事は、GitHub上で公開されているlangchain-aiのlanggraphリポジトリにおけるsdkのバージョン0.2.3のリリースについて説明しています。このリリースは2023年8月21日に行われ、主な変更点として、エンドポイントのカウント機能が追加されました。これにより、ユーザーはエンドポイントの数を簡単に把握できるようになります。前のバージョンである0.2.2からの変更点が強調されており、リリースノートには新機能の詳細が記載されています。 • リリースされたSDKのバージョンは0.2.3である。 • リリース日は2023年8月21日である。 • 新機能としてエンドポイントのカウント機能が追加された。 • 前のバージョンは0.2.2であり、そこからの変更点がある。 • リリースノートには新機能の詳細が記載されている。

langchain-ai/langgraph
release tool
langchain-openai==0.3.31

langchain-openai==0.3.31

この記事は、langchain-openaiのバージョン0.3.31のリリースに関する情報を提供しています。このリリースでは、いくつかのバグ修正が行われました。具体的には、gpt-5-chatモデルに対してtemperatureパラメータを許可する修正、API入力の構築に関する修正、チャットメッセージの注釈がリストまたはNoneでない場合にデフォルトで空のリストになるようにする修正が含まれています。これにより、ユーザーはより柔軟にAPIを利用できるようになります。 • gpt-5-chatモデルにtemperatureパラメータを許可する修正が行われた • API入力の構築に関するバグが修正された • チャットメッセージの注釈がデフォルトで空のリストになるように修正された • これによりAPIの利用がより柔軟になる

langchain-ai/langchain
api release tool
No Image

Quoting potatolicious

Most classical engineering fields deal with probabilistic system components all of the time. In fact I'd go as far as to say that inability to deal with probabilistic components is …

Simon Willison's Blog
platform
Fine-tune OpenAI GPT-OSS models using Amazon SageMaker HyperPod recipes

Fine-tune OpenAI GPT-OSS models using Amazon SageMaker HyperPod recipes

This post is the second part of the GPT-OSS series focusing on model customization with Amazon SageMaker AI. In Part 1, we demonstrated fine-tuning GPT-OSS models using open source Hugging Face libraries with SageMaker training jobs, which supports distributed multi-GPU and multi-node configurations, so you can spin up high-performance clusters on demand. In this post, […]

AWS Machine Learning Blog
api tool
Inline code nodes now supported in Amazon Bedrock Flows in public preview

Inline code nodes now supported in Amazon Bedrock Flows in public preview

We are excited to announce the public preview of support for inline code nodes in Amazon Bedrock Flows. With this powerful new capability, you can write Python scripts directly within your workflow, alleviating the need for separate AWS Lambda functions for simple logic. This feature streamlines preprocessing and postprocessing tasks (like data normalization and response formatting), simplifying generative AI application development and making it more accessible across organizations.

AWS Machine Learning Blog
api tool
Accelerate enterprise AI implementations with Amazon Q Business

Accelerate enterprise AI implementations with Amazon Q Business

Amazon Q Business offers AWS customers a scalable and comprehensive solution for enhancing business processes across their organization. By carefully evaluating your use cases, following implementation best practices, and using the architectural guidance provided in this post, you can deploy Amazon Q Business to transform your enterprise productivity. The key to success lies in starting small, proving value quickly, and scaling systematically across your organization.

AWS Machine Learning Blog
api tool
Speed up delivery of ML workloads using Code Editor in Amazon SageMaker Unified Studio

Speed up delivery of ML workloads using Code Editor in Amazon SageMaker Unified Studio

In this post, we walk through how you can use the new Code Editor and multiple spaces support in SageMaker Unified Studio. The sample solution shows how to develop an ML pipeline that automates the typical end-to-end ML activities to build, train, evaluate, and (optionally) deploy an ML model.

AWS Machine Learning Blog
library tool
2025-08-21

2025-08-21

この記事は、2025年8月21日にリリースされたMastraの新機能について説明しています。主な新機能として、複数の出力フォーマットをサポートする新しいstreamVNextおよびgenerateVNextメソッドが導入され、エージェントストリームと結果を変換するための出力プロセッサが追加されました。streamVNextメソッドは、MastraのネイティブフォーマットまたはAI SDK v5フォーマットのいずれかを選択できるように設定可能です。また、AI SDK v5のサポートが強化され、MessageListがv4およびv5メッセージフォーマットを同時に処理できるようになりました。さらに、エージェントネットワークにvnextストリーミング機能が追加され、エージェントメソッドはカスタマイズ可能で構造化された出力処理オプションを持つようになりました。 • 新しいstreamVNextおよびgenerateVNextメソッドが導入され、複数の出力フォーマットをサポート • streamVNextメソッドはMastraのネイティブフォーマットまたはAI SDK v5フォーマットを選択可能 • AI SDK v5のサポートが強化され、MessageListがv4およびv5メッセージフォーマットを同時に処理 • エージェントネットワークにvnextストリーミング機能が追加 • 出力プロセッサによりエージェントストリームの状態を管理し、出力処理を統一

mastra-ai/mastra
api release tool
From massive models to mobile magic: The tech behind YouTube real-time generative AI effects

From massive models to mobile magic: The tech behind YouTube real-time generative AI effects

この記事では、YouTubeがモバイルデバイス上でリアルタイムの生成AIエフェクトを提供するための技術について詳述しています。大規模な生成モデルの能力を小型化し、特定のタスクに特化したモデルを作成することで、計算制限を克服しつつユーザーのアイデンティティを保つ方法を説明しています。具体的には、データのキュレーション、トレーニング、デバイス上のセットアップを含むパイプラインを構築し、20以上のリアルタイムエフェクトをYouTube Shortsのクリエイター向けに展開しました。高品質なデータセットを使用し、知識蒸留の手法を用いて、教師モデルから学生モデルへと効率的に学習させるプロセスを採用しています。最終的に、モバイルデバイスで動作する小型で高速なモデルを設計し、リアルタイムでの映像変換を実現しています。 • YouTubeはモバイルデバイスでリアルタイムの生成AIエフェクトを提供する技術を開発した。 • 大規模モデルの能力を小型化し、特定のタスクに特化したモデルを作成することで計算制限を克服した。 • 高品質なデータセットを使用し、性別、年齢、肌色の多様性を考慮したデータを構築した。 • 知識蒸留を用いて、教師モデルから学生モデルへと効率的に学習させる手法を採用した。 • モバイルデバイス向けに設計された小型で高速なUNetベースのモデルを使用している。

Google Research
tool
Building and prototyping with Claude Code

Building and prototyping with Claude Code

Anthropic's Cat Wu (Claude Code) and Alex Albert (Claude Relations) discuss how the Claude Code team prototypes new features, best practices for using the Claude Code SDK and other learnings from building our agentic coding solution alongside developers. Learn more about Claude Code: http://clau.de/prototyping-claude-code Check out the Claude Code docs: https://clau.de/claude-code-docs 0:00 - Introductions 0:26 - How Anthropic prototypes new features with Claude Code 3:43 - Common use cases 5:47 - Usage patterns and "multi-Clauding" 7:13 - Customizing Claude Code (CLAUDE.md, slash commands, and hooks) 8:34 - Overview of the Claude Code SDK 10:13 - Using the Claude Code SDK to build agents 12:10 - Tips and best practices

YouTube Anthropic
How Infosys Topaz leverages Amazon Bedrock to transform technical help desk operations

How Infosys Topaz leverages Amazon Bedrock to transform technical help desk operations

In this blog, we examine the use case of a large energy supplier whose technical help desk agents answer customer calls and support field agents. We use Amazon Bedrock along with capabilities from Infosys Topaz™ to build a generative AI application that can reduce call handling times, automate tasks, and improve the overall quality of technical support.

AWS Machine Learning Blog
api tool
No Image

Quoting Matt Garman

I was at a leadership group and people were telling me "We think that with AI we can replace all of our junior people in our company." I was like, …

Simon Willison's Blog
platform
cli==0.3.8

cli==0.3.8

この記事は、GitHub上で公開されているlangchain-aiのlanggraphリポジトリにおけるcli==0.3.8のリリースについて説明しています。このリリースは2023年8月21日に行われ、主な変更点としてlanggraph-apiの最大制約が引き上げられたことが挙げられています。リリースノートには、前のバージョンであるcli==0.3.7からの変更点が記載されていますが、具体的な詳細は示されていません。リリースに関連するアセットも提供されていますが、ページの読み込み中にエラーが発生することがあります。 • cli==0.3.8のリリースは2023年8月21日である • 主な変更点はlanggraph-apiの最大制約の引き上げである • 前のバージョンcli==0.3.7からの変更点があるが詳細は不明 • リリースに関連するアセットが提供されている • ページの読み込み中にエラーが発生することがある

langchain-ai/langgraph
release tool
Microsoft is a Leader in the 2025 Gartner® Magic Quadrant™ for Cloud-Native Application Platforms

Microsoft is a Leader in the 2025 Gartner® Magic Quadrant™ for Cloud-Native Application Platforms

We’re proud to announce that Microsoft has been named a Leader in the 2025 Gartner® Magic Quadrant™ for Cloud-Native Application Platforms for a second year in a row, and the furthest to the right in Completeness of Vision. Learn more.

Microsoft AI Blog
api cloud tool
AI Gateway is now generally available

AI Gateway is now generally available

AI Gateway is now generally available, providing a single interface to access hundreds of AI models with transparent pricing and built-in observability.

Vercel Blog
api cloud tool
AI Gateway: Production-ready reliability for your AI apps

AI Gateway: Production-ready reliability for your AI apps

AI Gateway, now generally available, ensures availability when a provider fails, avoiding low rate limits and providing consistent reliability for AI workloads.

Vercel Blog
api tool
AI Mode in Search gets new agentic features and expands globally

AI Mode in Search gets new agentic features and expands globally

AI Mode in Google Search is expanding to more regions and adding more features.

Google AI Blog
api tool ui
Evaluating RAG, aka Optimizing the Optimization

Evaluating RAG, aka Optimizing the Optimization

RAG isn’t foolproof. Explore common hallucinations, evaluation metrics, and how to improve RAG accuracy in n8n.

n8n Blog
api tool
Scaling domain expertise in complex, regulated domains

Scaling domain expertise in complex, regulated domains

Blue J scaled its AI-powered tax research system to three countries and more than 3,000 firms thanks to focus, domain depth, and the right OpenAI model.

OpenAI Blog
tool
12 Best Autonomous AI Agents – 2025’s Top Picks

12 Best Autonomous AI Agents – 2025’s Top Picks

Tired of doing repetitive tasks? These 12 AI agents handle complex workflows independently while you focus on the fun stuff. Plus n8n tutorials for ultimate customization!

n8n Blog
tool
Patch release v4.55.3

Patch release v4.55.3

この記事は、Hugging FaceのTransformersライブラリのバージョン4.55.3のパッチリリースについて説明しています。このリリースは、FlashAttention-2のAscend NPUでの安定性向上、一般的なタスクモデルに対するFSDPの動作改善、GPT-OSSのMXFP4統合の修正に焦点を当てています。具体的には、FlashAttention-2における「利用不可」ランタイムエラーの修正、FAの引数準備の元に戻すことによる回帰の解決、FSDPのシャーディングおよびランタイムの問題の修正、MXFP4におけるswiglu_limitの正しい引き渡しの確保、Mambaのキャッシュ処理の修正が含まれています。 • FlashAttention-2のAscend NPUでの「利用不可」ランタイムエラーを修正 • FAの引数準備を元に戻し、回帰を解決 • FSDPの一般的なタスクモデルに対するシャーディングおよびランタイムの問題を修正 • MXFP4におけるswiglu_limitの正しい引き渡しを確保 • Mambaのキャッシュ処理を修正し、古い/不正確な状態を防止

huggingface/transformers
release tool
No Image

Quoting Mustafa Suleyman

Simply put, my central worry is that many people will start to believe in the illusion of AIs as conscious entities so strongly that they’ll soon advocate for AI rights, …

Simon Willison's Blog
platform
ターンテイキングのタイミング予測を簡単に試せるライブラリMaAIを使ってみた

ターンテイキングのタイミング予測を簡単に試せるライブラリMaAIを使ってみた

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。

AI-Shift Tech Blog
library tool
Mastra Changelog 2025-08-21

Mastra Changelog 2025-08-21

New streamVNext and generateVNext methods with AI SDK v5 support, output processors, and more.

Mastra Blog
ai api cloud
Hear how a decade-long bet on AI and hardware led to the new Pixel 10.

Hear how a decade-long bet on AI and hardware led to the new Pixel 10.

Ever wonder what it takes to build a phone a decade in the making?In the first episode of Season 8 Made by Google podcast, host Rachid Finge sits down with Venkat Rapaka…

Google AI Blog
cloud podcast
Create personalized products and marketing campaigns using Amazon Nova in Amazon Bedrock

Create personalized products and marketing campaigns using Amazon Nova in Amazon Bedrock

Built using Amazon Nova in Amazon Bedrock, The Fragrance Lab represents a comprehensive end-to-end application that illustrates the transformative power of generative AI in retail, consumer goods, advertising, and marketing. In this post, we explore the development of The Fragrance Lab. Our vision was to craft a unique blend of physical and digital experiences that would celebrate creativity, advertising, and consumer goods while capturing the spirit of the French Riviera.

AWS Machine Learning Blog
tool
Tyson Foods elevates customer search experience with an AI-powered conversational assistant

Tyson Foods elevates customer search experience with an AI-powered conversational assistant

In this post, we explore how Tyson Foods collaborated with the AWS Generative AI Innovation Center to revolutionize their customer interaction through an intuitive AI assistant integrated into their website. The AI assistant was built using Amazon Bedrock,

AWS Machine Learning Blog
api tool
Canva prototypes faster with GPT-5

Canva prototypes faster with GPT-5

Canva has always used AI to make design more accessible. CJ Jones, Canva’s Global Head of Design, GenAI, is using GPT-5 to prototype new features like polls and quizzes, and build faster for 100+ languages. Hear more in this short clip.

YouTube OpenAI
v0.17.5 Patch Release

v0.17.5 Patch Release

DeepSpeedのv0.17.5パッチリリースでは、いくつかの重要な変更が行われました。主な更新内容には、version.txtの更新、README.mdの修正、DeepSpeedEngineにおけるTP/PP/DPランクのゲッターAPIの追加、Coverityスキャンによって指摘された問題の修正、all-gatherの重複パラメータとデータ型の誤りの修正が含まれています。また、zero offloadチュートリアルに--bind_cores_to_rankオプションが追加され、ZenFlowに関するブログも追加されました。さらに、CPU専用マシンでの事前コンパイルの修正や、PyTorch v2.8に対するDeepCompileの修正も行われています。これらの変更により、DeepSpeedのパフォーマンスと互換性が向上しています。 • DeepSpeedのv0.17.5パッチリリースが行われた。 • version.txtとREADME.mdが更新された。 • DeepSpeedEngineにTP/PP/DPランクのゲッターAPIが追加された。 • Coverityスキャンによる問題が修正された。 • all-gatherの重複パラメータとデータ型の誤りが修正された。 • zero offloadチュートリアルに--bind_cores_to_rankオプションが追加された。 • ZenFlowに関するブログが追加された。 • CPU専用マシンでの事前コンパイルの修正が行われた。

microsoft/DeepSpeed
release tool
Enhance AI agents using predictive ML models with Amazon SageMaker AI and Model Context Protocol (MCP)

Enhance AI agents using predictive ML models with Amazon SageMaker AI and Model Context Protocol (MCP)

In this post, we demonstrate how to enhance AI agents’ capabilities by integrating predictive ML models using Amazon SageMaker AI and the MCP. By using the open source Strands Agents SDK and the flexible deployment options of SageMaker AI, developers can create sophisticated AI applications that combine conversational AI with powerful predictive analytics capabilities.

AWS Machine Learning Blog
framework tool
No Image

Quoting u/AssafMalkiIL

what’s the point of vibe coding if at the end of the day i still gotta pay a dev to look at the code anyway. sure it feels kinda cool …

Simon Willison's Blog
tool
Securing private data at scale with differentially private partition selection

Securing private data at scale with differentially private partition selection

本記事では、ユーザープライバシーを保護するための新しいアルゴリズムを提案し、差分プライバシーに基づくパーティション選択の最先端を改善する方法を紹介しています。大規模なユーザーデータセットはAIや機械学習モデルの進展に不可欠ですが、データプライバシーのリスクも伴います。差分プライバシーを適用することで、個々のデータが特定のアイテムに寄与したかどうかを知られないようにしつつ、意味のあるアイテムのサブセットを安全に共有することが可能です。特に、並列アルゴリズムを用いることで、数百億のアイテムを含むデータセットを効率的に処理し、プライバシーを確保しながらもデータの有用性を損なわないことができます。最近の研究では、ICML2025で発表された「スケーラブルなプライベートパーティション選択に関する適応重み付け」を通じて、最適なプライバシーと有用性のトレードオフを実現する効率的なアルゴリズムを紹介しています。 • ユーザープライバシーを保護するための新しいアルゴリズムを提案 • 差分プライバシーに基づくパーティション選択の改善 • 大規模データセットのプライバシーリスクに対処 • 並列アルゴリズムを用いて数百億のアイテムを効率的に処理 • プライバシーを確保しつつデータの有用性を維持 • 最適なプライバシーと有用性のトレードオフを実現 • GitHubでのオープンソース化を通じて研究コミュニティの協力を促進

Google Research
api tool
No Image

ZenFlow: Stall-Free Offloading Engine for LLM Training

ZenFlowは、2025年夏に導入されたDeepSpeedの新しい拡張機能で、大規模言語モデル(LLM)のトレーニング用に設計されたスタールフリーオフロードエンジンです。オフロードは、増大するLLMサイズによるGPUメモリ圧力を軽減するための一般的な手法ですが、従来のオフロードフレームワークはCPUとGPUの性能差により、GPUのスタールが発生する問題があります。ZenFlowは、重要度に基づくパイプライニングを用いてGPUとCPUの更新を分離し、CPUの作業とPCIe転送をGPU計算と完全に重ね合わせることで、85%以上のスタール削減と最大5倍のスピードアップを実現します。これにより、オフロードのメモリ利点を享受しつつ、遅いハードウェアによるトレーニング速度の低下を防ぎます。ZenFlowは、即時にGPU更新される重要な勾配を優先し、残りは非同期でCPUにオフロードすることで、スタールを排除し、シングルGPUおよびマルチGPU環境でのハードウェア利用率を高めます。 • ZenFlowは、DeepSpeedの新しいオフロードエンジンで、LLMトレーニングのスタールを排除することを目的としている。 • 重要度に基づくパイプライニングを使用して、GPUとCPUの更新を分離し、CPU作業とPCIe転送をGPU計算と重ね合わせる。 • 85%以上のスタール削減と最大5倍のスピードアップを実現し、トレーニング速度を向上させる。 • 即時にGPU更新される重要な勾配を優先し、低優先度の勾配は非同期でCPUにオフロードする。 • モデルの精度を維持し、DeepSpeedとのシームレスな統合を実現。

PyTorch Blog
library tool
‘It’s going to be a big deal’: The NFL and Microsoft expand their partnership and introduce sideline technology using AI innovation

‘It’s going to be a big deal’: The NFL and Microsoft expand their partnership and introduce sideline technology using AI innovation

The NFL and Microsoft announced a multi-year strategic partnership extension to help usher in a new era of AI innovation throughout the league.

Microsoft AI Blog
api tool
Mixi reimagines communication with ChatGPT

Mixi reimagines communication with ChatGPT

Discover how MIXI deployed ChatGPT Enterprise in just 45 days, and scaled company-wide adoption.

OpenAI Blog
tool
AI in Education Report: Insights to support teaching and learning

AI in Education Report: Insights to support teaching and learning

Read the 2025 AI in Education Report from Microsoft for insights on learning, teaching, workforce readiness, and institutional innovation.

Microsoft AI Blog
platform tool
9 ways AI makes Pixel 10 our most helpful phone yet

9 ways AI makes Pixel 10 our most helpful phone yet

From smart organization to helpful reminders across apps, here are ways to try AI on Pixel 10 phones.

Google AI Blog
tool
David Ho on BlueSky: A pelican tried to eat my bike

David Ho on BlueSky: A pelican tried to eat my bike

David Ho caught video footage of one of the pelicans in St James's Park expressing deep curiosity in his bicycle. I think it wants to ride it.

Simon Willison's Blog
tool
0.54.0 - 2025-08-20

0.54.0 - 2025-08-20

この記事は、GitHub上のオープンソースプロジェクト「OpenHands」のバージョン0.54.0のリリースノートを紹介しています。このリリースでは、長期タスクのためのタスク追跡ツールと計画モードが追加され、エージェントが仕事を完了しなかった場合の新しいフィードバック理由が導入されました。また、OpenHands CloudでのMCP(Model Context Protocol)が有効化され、MCP設定UIが改善されました。さらに、UIのフラッシュ問題やブラウザタブタイトルのリセットに関するバグが修正されました。新たに数名の貢献者がプロジェクトに参加したことも報告されています。 • 長期タスクのためのタスク追跡ツールと計画モードが追加された • エージェントが仕事を完了しなかった場合のフィードバック理由が新たに追加された • OpenHands CloudでMCPが有効化された • MCP設定UIが改善され、追加、編集、削除機能が実装された • UIのフラッシュ問題やブラウザタブタイトルのリセットに関するバグが修正された • 新たに数名の貢献者がプロジェクトに参加した

All-Hands-AI/OpenHands
release tool
Stephen Curry is bringing his elite athlete insights to Google products

Stephen Curry is bringing his elite athlete insights to Google products

Learn more about Google’s partnership with NBA player Stephen Curry.

Google AI Blog
tool
Does Gemini CLI fall short? Here’s how Codex compares

Does Gemini CLI fall short? Here’s how Codex compares

Compare Codex CLI vs Gemini CLI for real-world coding tasks. See strengths, weaknesses, and which AI CLI fits your developer workflow best.

logrocket-dev
api tool
<script type="text/llms.txt">

<script type="text/llms.txt">

llms.txt is an emerging standard for making content such as docs available for direct consumption by AIs. We’re proposing a convention to include such content directly in HTML responses.

Vercel Blog
api tool
Release v3.25.20

Release v3.25.20

この記事は、RooCodeIncのGitHubリポジトリにおけるリリースv3.25.20についての情報を提供しています。このリリースは2025年8月19日に行われ、Sonicモデルに関するアナウンスが追加されました。リリースの詳細や変更点については記載されていませんが、GitHub上での署名や通知設定に関する情報も含まれています。リリースのバージョン管理やコミットの署名についても言及されています。 • リリースバージョンはv3.25.20である • リリース日は2025年8月19日 • Sonicモデルに関するアナウンスが追加された • GitHubでの署名や通知設定に関する情報が含まれている • 具体的な変更点や詳細は記載されていない

RooCodeInc/Roo-Code
release tool
0.6.6

0.6.6

この記事は、GitHub上のlangchain-ai/langgraphリポジトリのバージョン0.6.6のリリースノートについて説明しています。このリリースでは、いくつかの重要な変更が行われました。まず、リモートバゲージに関する修正が行われ、次に、invokeやstreamなどの機能にパススルーパラメータやヘッダーが追加されました。また、Python SDKにクライアントのクエリパラメータが追加されるという新機能も含まれています。これらの変更は、ユーザーがより柔軟にAPIを利用できるようにすることを目的としています。 • リモートバゲージに関する修正が行われた。 • invokeやstream機能にパススルーパラメータやヘッダーが追加された。 • Python SDKにクライアントのクエリパラメータが追加された。 • これにより、APIの利用がより柔軟になる。

langchain-ai/langgraph
release tool
Release v3.25.19

Release v3.25.19

RooCodeIncのGitHubリポジトリで公開されたリリースv3.25.19は、2025年8月19日に行われました。このリリースでは、新しいユーザーがRoo Code Cloudプロバイダーを選択できない問題が修正されました。この修正は、ユーザーdaniel-lxsによって報告され、対応されました。リリースはGitHubの検証された署名で作成されており、信頼性が確保されています。 • 新しいユーザーがRoo Code Cloudプロバイダーを選択できない問題が修正された • 修正はユーザーdaniel-lxsによって報告された • リリースはGitHubの検証された署名で作成された • リリース日は2025年8月19日である

RooCodeInc/Roo-Code
release tool
Release v3.25.18

Release v3.25.18

RooCodeIncのGitHubリポジトリで公開されたリリースv3.25.18では、新しいStealth Sonicモデルが追加され、Roo Code Cloudプロバイダーを通じて利用可能になった。また、reasoning使用時の設定を尊重する修正や、ケースインセンシティブでの重複LMスタジオモデルを防ぐ修正が行われた。さらに、ask_followup_questionプロンプトのドキュメントが簡素化され、単一ファイル専用モデル用のread_fileツールが追加された。最後に、vscode-lm用の新しいモデルと設定が更新された。 • 新しいStealth Sonicモデルが追加された • reasoning使用時の設定を尊重する修正が行われた • ケースインセンシティブでの重複LMスタジオモデルを防ぐ修正が実施された • ask_followup_questionプロンプトのドキュメントが簡素化された • 単一ファイル専用モデル用のread_fileツールが追加された • vscode-lm用の新しいモデルと設定が更新された

RooCodeInc/Roo-Code
release tool
How SoftBank is restoring Japan's white-collar productivity using Mastra

How SoftBank is restoring Japan's white-collar productivity using Mastra

SoftBank's Satto Workspace platform, built with Mastra, transforms document creation from hours to minutes, with the goal of addressing Japan's 25-year white-collar productivity decline.

Mastra Blog
ai framework tool
Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency

Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency

As promised in their August 4th release of the Qwen image generation model, Qwen have now followed it up with a separate model, Qwen-Image-Edit, which can take an image and …

Simon Willison's Blog
tool
Simplify access control and auditing for Amazon SageMaker Studio using trusted identity propagation

Simplify access control and auditing for Amazon SageMaker Studio using trusted identity propagation

In this post, we explore how to enable and use trusted identity propagation in Amazon SageMaker Studio, which allows organizations to simplify access management by granting permissions to existing AWS IAM Identity Center identities. The solution demonstrates how to implement fine-grained access controls based on a physical user's identity, maintain detailed audit logs across supported AWS services, and support long-running user background sessions for training jobs.

AWS Machine Learning Blog
api tool
@browserbasehq/stagehand@2.4.3

@browserbasehq/[email protected]

この記事は、GitHub上で公開された@browserbasehq/stagehandのバージョン2.4.3のリリースノートを提供しています。このリリースには、いくつかのパッチ変更が含まれており、特にGPT-5の新しいAPIフォーマットへの対応や、シャドウDOMのサポートが追加されています。また、iframe内でのスクロールを有効にし、画像の処理を適切に行うための修正も行われています。さらに、同じプロセス内のiframeからのコンテンツ取得に関する問題の修正や、XPathビルドステップでの名前空間要素の処理も改善されています。 • GPT-5の新しいAPIフォーマットに対応 • シャドウDOMのサポートを追加 • iframe内でのスクロールを有効にした • 画像の処理とレスポンス解析ロジックを改善 • 同じプロセス内のiframeからのコンテンツ取得の問題を修正 • XPathビルドステップでの名前空間要素の処理を改善

browserbase/stagehand
release tool
llama.cpp guide: running gpt-oss with llama.cpp

llama.cpp guide: running gpt-oss with llama.cpp

Really useful official guide to running the OpenAI gpt-oss models using llama-server from llama.cpp - which provides an OpenAI-compatible localhost API and a neat web interface for interacting with the …

Simon Willison's Blog
tool
Benchmarking document information localization with Amazon Nova

Benchmarking document information localization with Amazon Nova

This post demonstrates how to use foundation models (FMs) in Amazon Bedrock, specifically Amazon Nova Pro, to achieve high-accuracy document field localization while dramatically simplifying implementation. We show how these models can precisely locate and interpret document fields with minimal frontend effort, reducing processing errors and manual intervention.

AWS Machine Learning Blog
api cloud tool
How Infosys built a generative AI solution to process oil and gas drilling data with Amazon Bedrock

How Infosys built a generative AI solution to process oil and gas drilling data with Amazon Bedrock

We built an advanced RAG solution using Amazon Bedrock leveraging Infosys Topaz™ AI capabilities, tailored for the oil and gas sector. This solution excels in handling multimodal data sources, seamlessly processing text, diagrams, and numerical data while maintaining context and relationships between different data elements. In this post, we provide insights on the solution and walk you through different approaches and architecture patterns explored, like different chunking, multi-vector retrieval, and hybrid search during the development.

AWS Machine Learning Blog
api tool
Uber uses GPT-5 to balance speed and quality

Uber uses GPT-5 to balance speed and quality

Uber's early explorations with GPT-5 have shown the potential to deliver richer responses that feel more natural and helpful. Hear more from Jai Malkani, Uber’s Global Head of AI & Product, Customer Obsession, in this short video.

YouTube OpenAI
No Image

PyPI: Preventing Domain Resurrection Attacks

Domain resurrection attacks are a nasty vulnerability in systems that use email verification to allow people to recover their accounts. If somebody lets their domain name expire an attacker might …

Simon Willison's Blog
api security
Unlocking the potential of manufacturing with cloud modernization

Unlocking the potential of manufacturing with cloud modernization

Uncover how manufacturers use AI and cloud to optimize operations, accelerate R&D, and deliver real business value. Learn more.

Microsoft AI Blog
cloud tool
Streamline employee training with an intelligent chatbot powered by Amazon Q Business

Streamline employee training with an intelligent chatbot powered by Amazon Q Business

In this post, we explore how to design and implement custom plugins for Amazon Q Business to create an intelligent chatbot that streamlines employee training by retrieving answers from training materials. The solution implements secure API access using Amazon Cognito for user authentication and authorization, processes multiple document formats, and includes features like RAG-enhanced responses and email escalation capabilities through custom plugins.

AWS Machine Learning Blog
api tool
Don’t let AI erase the next generation of dev leaders

Don’t let AI erase the next generation of dev leaders

If AI snaps up all of their opportunities to learn, junior engineers can never grow into senior roles. Then who’s left to lead the engineering teams of the future?

logrocket-dev
tool
No Image

r/ChatGPTPro: What is the most profitable thing you have done with ChatGPT?

This Reddit thread - with 279 replies - offers a neat targeted insight into the kinds of things people are using ChatGPT for. Lots of variety here but two themes …

Simon Willison's Blog
platform
MASTRA.BUILD Templates Hackathon Winners & Community Templates Library

MASTRA.BUILD Templates Hackathon Winners & Community Templates Library

Celebrating the winners of our MASTRA.BUILD templates hackathon and launching our new community templates library

Mastra Blog
ai framework tool
Generate Images with Claude and Hugging Face

Generate Images with Claude and Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
tool
No Image

Google Gemini URL Context

New feature in the Gemini API: you can now enable a url_context tool which the models can use to request the contents of URLs as part of replying to a …

Simon Willison's Blog
api tool
Create a travel planning agentic workflow with Amazon Nova

Create a travel planning agentic workflow with Amazon Nova

In this post, we explore how to build a travel planning solution using AI agents. The agent uses Amazon Nova, which offers an optimal balance of performance and cost compared to other commercial LLMs. By combining accurate but cost-efficient Amazon Nova models with LangGraph orchestration capabilities, we create a practical travel assistant that can handle complex planning tasks while keeping operational costs manageable for production deployments.

AWS Machine Learning Blog
api cloud tool
sdk==0.2.2

sdk==0.2.2

この記事は、GitHub上で公開されているlangchain-aiのlanggraphリポジトリにおけるSDKのバージョン0.2.2のリリースについて説明しています。このリリースでは、主に以下の変更が行われました。まず、SDKの型情報が更新され、より正確な型定義が提供されました。次に、LangGraphClientに新たに「aclose」メソッドが追加され、クライアントのクリーンアップが容易になりました。さらに、SDK内のパラメータの型も更新され、より一貫性のあるインターフェースが実現されています。これらの変更により、開発者はより効率的にSDKを利用できるようになります。 • SDKのバージョン0.2.2がリリースされた • 型情報が更新され、正確な型定義が提供された • LangGraphClientに「aclose」メソッドが追加された • SDK内のパラメータの型が更新された • これにより開発者はSDKをより効率的に利用できるようになる

langchain-ai/langgraph
release tool
langchain-anthropic==0.3.19

langchain-anthropic==0.3.19

この記事は、langchain-anthropicのバージョン0.3.19のリリースに関するもので、主にClaude-3.5 Sonnetの最新バージョンへの参照更新や、ストリーミングにおけるinput_tokenのカウントの修正、メッセージフォーマット時の引用におけるnull file_idフィールドのクリーンアップなどの変更点が記載されています。また、ツール使用ブロックのサニタイズや、キャッシュ制御をkwargとしてサポートする機能追加、テストモデル名の更新と統合テストにおけるトークンカウントのアサーション調整も行われています。これらの変更は、主に機能の改善とバグ修正を目的としています。 • langchain-anthropicのバージョン0.3.19がリリースされた • Claude-3.5 Sonnetの最新バージョンへの参照が更新された • ストリーミングにおけるinput_tokenのカウントが修正された • メッセージフォーマット時のnull file_idフィールドがクリーンアップされた • ツール使用ブロックのサニタイズが行われた • キャッシュ制御をkwargとしてサポートする機能が追加された • テストモデル名の更新とトークンカウントのアサーション調整が行われた

langchain-ai/langchain
release tool
sdk==0.2.1

sdk==0.2.1

この記事は、GitHub上で公開されているlangchain-aiのlanggraphリポジトリにおけるsdkのバージョン0.2.1のリリースについて説明しています。このリリースは2023年8月18日に行われ、主な変更点として、クライアントのクエリパラメータに関する機能追加(#5918)と、Selectステートメントに関する機能追加(#5933)が含まれています。これにより、SDKの機能が強化され、ユーザーはより柔軟にクエリを構築できるようになります。 • リリース日: 2023年8月18日 • バージョン: sdk==0.2.1 • 主な変更点: クライアントのクエリパラメータ機能追加 (#5918) • 主な変更点: Selectステートメント機能追加 (#5933) • SDKの機能強化により、クエリ構築が柔軟に行えるようになる

langchain-ai/langgraph
release tool
1.0.20

1.0.20

この記事は、GitHub上のchroma-coreプロジェクトのリリース1.0.20に関する情報を提供しています。このリリースは2025年8月18日に行われ、バージョン1.0.20のビルド日や、PIPパッケージ、DockerHubイメージなどの詳細が含まれています。また、リリースノートには、前のバージョン1.0.19からの変更点が記載されており、特に@itaismithによる更新が強調されています。リリースの詳細には、GitHubの署名付きコミットや、バージョン管理に関する情報も含まれています。 • リリースバージョンは1.0.20で、2025年8月18日に公開された。 • PIPパッケージとしてchromа-1.0.20.tar.gzが提供されている。 • DockerHubイメージも1.0.20として利用可能。 • リリースノートには、1.0.19からの変更点が含まれている。 • 更新は@itaismithによって行われた。

chroma-core/chroma
release tool
No Image

Accelerating MoE’s with a Triton Persistent Cache-Aware Grouped GEMM Kernel

この記事では、Mixture-of-Experts(MoE)モデルのトレーニングと推論を行うための最適化されたTriton BF16 Grouped GEMMカーネルについて説明しています。Grouped GEMMは、入力テンソルの複数のスライスに対して独立したGEMMを単一のカーネル呼び出しで適用します。従来のPyTorch実装では、これらのGEMMはグループごとにforループで実行されていましたが、提案されたカーネルはNVIDIA H100 GPU上でDeepSeekv3のトレーニング時に最大2.62倍の速度向上を実現します。GEMMはLLMワークロードにおいて基本的な演算であり、MoEモデルではトークンが異なる専門家に動的にルーティングされるため、多くの独立したGEMMが発生します。Grouped GEMMは、これらの小さなGEMMを一つのカーネル呼び出しで実行することで、起動オーバーヘッドを削減し、GPUの利用効率を向上させます。 • MoEモデルのトレーニングと推論を最適化するためのTriton BF16 Grouped GEMMカーネルを提案 • Grouped GEMMは複数のスライスに対して独立したGEMMを適用し、従来のforループ実装よりも効率的 • NVIDIA H100 GPU上で最大2.62倍の速度向上を実現 • GEMMはLLMワークロードにおいて重要な演算であり、効率がモデルの速度に影響を与える • Persistent Kernel Designを用いて、スレッドブロックを「生かしたまま」にして計算を行うことで、起動オーバーヘッドを削減し、キャッシュの再利用を改善

PyTorch Blog
library tool
14 ways Googlers use AI to work smarter

14 ways Googlers use AI to work smarter

See how Googlers are using tools like Gemini and Imagen to save time, spark new ideas and build more helpful products.

Google AI Blog
tool
cli-1.1.8

cli-1.1.8

この記事は、GitHub上のchroma-coreリポジトリにおけるcli-1.1.8のリリースについて説明しています。このリリースは2023年8月18日に行われ、GitHubの署名付きコミットとして作成されました。リリースには6つのアセットが含まれていますが、詳細な内容や変更点については記載されていません。また、リリースに関連する通知設定の変更や、GitHubのバージョン管理機能についても言及されています。 • cli-1.1.8のリリース日が2023年8月18日であること • リリースはGitHubの署名付きコミットとして作成されたこと • リリースには6つのアセットが含まれているが、詳細は不明であること • GitHubの通知設定に関する情報が含まれていること

chroma-core/chroma
release tool
1.0.18

1.0.18

この記事は、Chromaのバージョン1.0.18のリリースノートを提供しています。このリリースでは、CLIコマンドに短い説明が追加され、距離計算にAVXが使用されるようになりました。また、PythonのCloudClientでテナントとスコープ付きデータベースが自動設定される機能が強化されています。さらに、get_rangeメソッドがイテレータを返すように変更され、ガーベジコレクションのCLIが手動でのガーベジコレクションを可能にしました。バグ修正としては、カーソルのロールバック時にダーティマークを付けることでコンパクションが正しく行われるようにし、デッドロックの解決も含まれています。全体として、パフォーマンスの最適化や新機能の追加が行われたことが強調されています。 • CLIコマンドに短い説明が追加された • 距離計算にAVXが使用されるようになった • PythonのCloudClientでテナントとスコープ付きデータベースが自動設定される • get_rangeメソッドがイテレータを返すように変更された • ガーベジコレクションのCLIが追加された • カーソルのロールバック時にダーティマークを付けることでコンパクションが保証される • デッドロックの解決が行われた

chroma-core/chroma
release tool
cli-1.1.7

cli-1.1.7

この記事は、GitHub上でのchroma-coreプロジェクトのCLIバージョン1.1.7のリリースに関する情報を提供しています。このリリースは2023年8月18日に行われ、GitHubの署名付きコミットとして記録されています。CLIの最新バージョンには、6つのアセットが含まれており、ユーザーはこれらをダウンロードして利用することができます。リリースに関する通知設定を変更するには、サインインが必要です。 • CLIバージョン1.1.7が2023年8月18日にリリースされた • リリースはGitHubの署名付きコミットとして記録されている • 6つのアセットが含まれている • ユーザーはアセットをダウンロードして利用可能 • 通知設定の変更にはサインインが必要

chroma-core/chroma
release tool
Release v3.25.17

Release v3.25.17

RooCodeIncのGitHubリポジトリで公開されたリリースv3.25.17は、2025年8月17日に行われたもので、ターミナルの再利用ロジックに関する問題を修正しています。このリリースは、GitHubの検証された署名で作成されており、ユーザーは通知設定を変更するためにサインインする必要があります。リリースの詳細やアセットは、GitHubのインターフェースを通じて確認できます。 • ターミナルの再利用ロジックに関する問題を修正 • リリースはGitHubの検証された署名で作成 • ユーザーは通知設定を変更するためにサインインが必要 • リリースの詳細はGitHubで確認可能

RooCodeInc/Roo-Code
release tool
Q&A with DoorDash’s CPO, Mariana Garavaglia

Q&A with DoorDash’s CPO, Mariana Garavaglia

A conversation with Mariana Garavaglia, Chief People Officer, DoorDash.

OpenAI Blog
api tool
MCP for Research: How to Connect AI to Research Tools

MCP for Research: How to Connect AI to Research Tools

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api tool
🥇Top AI Papers of the Week

🥇Top AI Papers of the Week

The Top AI Papers of the Week (August 11-17)

Elvis Saravia's NLP Blog
platform
Using Grok 4 in the frontend development: Here’s what I’ve learned

Using Grok 4 in the frontend development: Here’s what I’ve learned

Tested Grok 4 on real frontend tasks. See how it compares to Claude, Gemini, and Kimi, plus cost, token use, and when to use it for dev work.

logrocket-dev
api tool
No Image

TIL: Running a gpt-oss eval suite against LM Studio on a Mac

The other day I learned that OpenAI published a set of evals as part of their gpt-oss model release, described in their cookbook on Verifying gpt-oss implementations. I decided to …

Simon Willison's Blog
tool
Release v3.25.16

Release v3.25.16

RooCodeIncのリリースv3.25.16では、OpenAIのgpt-5-chat-latestモデルのサポートが追加され、Ollama APIを使用するように修正されました。また、XMLエンティティのデコードを防ぐための修正や、diffItem.contentに対する.match()呼び出し前の型チェックの追加が行われました。タスク実行システムのリファクタリングにより、コールスタック管理が改善され、タスクのIDによる再開APIが追加されました。さらに、タスク要求がインタラクションを必要とする際にイベントを発信する機能も実装されました。これにより、ユーザーはタスクの履歴をデフォルトで強化することが可能になり、複数フォルダのワークスペースチェックポイントに関するホットフィックスも行われました。 • OpenAI gpt-5-chat-latestモデルのサポート追加 • Ollama APIの使用に修正 • XMLエンティティデコード防止の修正 • diffItem.contentに対する型チェックの追加 • タスク実行システムのリファクタリングによるコールスタック管理の改善 • タスクのIDによる再開APIの追加 • タスク要求がインタラクションを必要とする際のイベント発信機能の実装 • タスク履歴のデフォルト強化機能の追加 • 複数フォルダのワークスペースチェックポイントに関するホットフィックス

RooCodeInc/Roo-Code
api release tool
No Image

Quoting Sam Altman

Most of what we're building out at this point is the inference [...] We're profitable on inference. If we didn't pay for training, we'd be a very profitable company.

Simon Willison's Blog
platform
🤖 AI Agents Weekly: DINOv3, Claude Sonnet-1M, GLM-4.5V, Benchmarking AI Agent Memory, Deep Agents, Claude Code Output Styles

🤖 AI Agents Weekly: DINOv3, Claude Sonnet-1M, GLM-4.5V, Benchmarking AI Agent Memory, Deep Agents, Claude Code Output Styles

DINOv3, Claude Sonnet-1M, GLM-4.5V, Benchmarking AI Agent Memory, Deep Agents, Claude Code Output Styles

Elvis Saravia's NLP Blog
platform
Cerebras Code(Qwen3-Coder)の申し込みが再開

Cerebras Code(Qwen3-Coder)の申し込みが再開

AIインフラを手がける新興企業Cerebrasが2025年8月1日に発表した「Cerebras Code」は、中国Alibabaの「Qwen3-Coder」モデルを用いた月額定額サービスで、個人開発者や小規模チームを対象に、コーディングエージェント向けのAPIを提供します。 CerebrasCerebras is the go-to platform for fast and effortless AI training. Learn more at cerebras.ai.Daniel Kim 8月1週の開始直後に申し込みが殺到したらしく、しばらく受付を停止していましたが[1]、今週から再開したようです。 [1]https://x.com/CerebrasSystems/status/1952512742574768599 料金は月額50ドル(Code Pro)と200ドル(Code Max)です。CerebrasはもともとLlama 4ベースの月1500ドルを超えるAPIをエンタープライズ向けに売っていましたが、Claude CodeのMaxプランに対抗するような形でこのプラ

Lai.so Blog
api cloud tool
LLM へのプロンプトを構造化された文書で管理する POML

LLM へのプロンプトを構造化された文書で管理する POML

POML (Prompt Orchestration Markup Language) は、Microsoft によって提案されたプロンプトを構造化された文書として管理するためのマークアップ言語です。プロンプト開発における構造の欠如や複雑なデータとの統合の困難さ、特定のフォーマットへの依存性といった課題を解決することを目指しています。

azukiazusa のテックブログ2
api tool
No Image

GPT-5 has a hidden system prompt

It looks like GPT-5 when accessed via the OpenAI API may have its own hidden system prompt, independent from the system prompt you can specify in an API call. At …

Simon Willison's Blog
api
The Summer of Johann: prompt injections as far as the eye can see

The Summer of Johann: prompt injections as far as the eye can see

Independent AI researcher Johann Rehberger (previously) has had an absurdly busy August. Under the heading The Month of AI Bugs he has been publishing one report per day across an …

Simon Willison's Blog
api security tool
No Image

Meta’s AI rules have let bots hold ‘sensual’ chats with kids, offer false medical info

This is grim. Reuters got hold of a leaked copy Meta's internal "GenAI: Content Risk Standards" document: Running to more than 200 pages, the document defines what Meta staff and …

Simon Willison's Blog
security
Interpretability: Understanding how AI models think

Interpretability: Understanding how AI models think

What's happening inside an AI model as it thinks? Why are AI models sycophantic, and why do they hallucinate? Are AI models just "glorified autocompletes", or is something more complicated going on? How do we even study these questions scientifically? Join Anthropic's Josh Batson, Emmanuel Ameisen, and Jack Lindsey as they discuss the latest research on AI interpretability. Read more about Anthropic's interpretability research: https://www.anthropic.com/news/tracing-thoughts-language-model Sections: Introduction [00:00] The biology of AI models [01:37] Scientific methods to open the black box [6:43] Some surprising features inside Claude's mind [10:35] Can we trust what a model claims it's thinking? [20:39] Why do AI models hallucinate? [25:17] AI models planning ahead [34:15] Why interpretability matters [38:30] The future of interpretability [53:35]

YouTube Anthropic
Introducing Amazon Bedrock AgentCore Gateway: Transforming enterprise AI agent tool development

Introducing Amazon Bedrock AgentCore Gateway: Transforming enterprise AI agent tool development

In this post, we discuss Amazon Bedrock AgentCore Gateway, a fully managed service that revolutionizes how enterprises connect AI agents with tools and services by providing a centralized tool server with unified interface for agent-tool communication. The service offers key capabilities including Security Guard, Translation, Composition, Target extensibility, Infrastructure Manager, and Semantic Tool Selection, while implementing sophisticated dual-sided security architecture for both inbound and outbound connections.

AWS Machine Learning Blog
api cloud tool
Build a scalable containerized web application on AWS using the MERN stack with Amazon Q Developer – Part 1

Build a scalable containerized web application on AWS using the MERN stack with Amazon Q Developer – Part 1

In a traditional SDLC, a lot of time is spent in the different phases researching approaches that can deliver on requirements: iterating over design changes, writing, testing and reviewing code, and configuring infrastructure. In this post, you learned about the experience and saw productivity gains you can realize by using Amazon Q Developer as a coding assistant to build a scalable MERN stack web application on AWS.

AWS Machine Learning Blog
cloud tool
Optimizing Salesforce’s model endpoints with Amazon SageMaker AI inference components

Optimizing Salesforce’s model endpoints with Amazon SageMaker AI inference components

In this post, we share how the Salesforce AI Platform team optimized GPU utilization, improved resource efficiency and achieved cost savings using Amazon SageMaker AI, specifically inference components.

AWS Machine Learning Blog
tool
Open weight LLMs exhibit inconsistent performance across providers

Open weight LLMs exhibit inconsistent performance across providers

Artificial Analysis published a new benchmark the other day, this time focusing on how an individual model—OpenAI’s gpt-oss-120b—performs across different hosted providers. The results showed some surprising differences. Here’s the …

Simon Willison's Blog
api cloud tool
No Image

Quoting Steve Wozniak

I gave all my Apple wealth away because wealth and power are not what I live for. I have a lot of fun and happiness. I funded a lot of …

Simon Willison's Blog
platform
AGI progress, surprising breakthroughs, and the road ahead — the OpenAI Podcast Ep. 5

AGI progress, surprising breakthroughs, and the road ahead — the OpenAI Podcast Ep. 5

How close are we to automating scientific discovery? What do AI competition wins really tell us about progress toward AGI? OpenAI Chief Scientist Jakub Pachocki and researcher Szymon Sidor share inside stories—from gold medals at the International Math Olympiad to surprising leaps in reasoning—that reveal where AI is headed next. Chapters 1:20 – From high school in Poland to AI research leaders 4:50 – Explaining AGI: technical and everyday perspectives 6:30 – Automating scientific discovery with AI 7:50 – Breakthroughs in medicine, AI safety, and alignment 10:30 – Today is a decade in the making 14:30 – Benchmark saturation and its limits 16:50 – Why math competitions matter for AI 18:15 – How models reason without tools 21:45 – Recognizing when a model can’t solve a problem 23:30 – Storytime: AtCoder competition in Japan 26:50 – How reasoning breakthroughs really happen 28:55 – What’s next for scaling and long-horizon reasoning 30:30 – What AGI will look and feel like 36:25 – Balancing trust and personal value 34:00 – Advice to high school students in 2025

YouTube OpenAI
Building a RAG chat-based assistant on Amazon EKS Auto Mode and NVIDIA NIMs

Building a RAG chat-based assistant on Amazon EKS Auto Mode and NVIDIA NIMs

In this post, we demonstrate the implementation of a practical RAG chat-based assistant using a comprehensive stack of modern technologies. The solution uses NVIDIA NIMs for both LLM inference and text embedding services, with the NIM Operator handling their deployment and management. The architecture incorporates Amazon OpenSearch Serverless to store and query high-dimensional vector embeddings for similarity search.

AWS Machine Learning Blog
cloud tool
Introducing Amazon Bedrock AgentCore Identity: Securing agentic AI at scale

Introducing Amazon Bedrock AgentCore Identity: Securing agentic AI at scale

In this post, we explore Amazon Bedrock AgentCore Identity, a comprehensive identity and access management service purpose-built for AI agents that enables secure access to AWS resources and third-party tools. The service provides robust identity management features including agent identity directory, agent authorizer, resource credential provider, and resource token vault to help organizations deploy AI agents securely at scale.

AWS Machine Learning Blog
api cloud security
The Next Wave of Dev Tools: AI Assistants and JavaScript Workflows - JSJ 686

The Next Wave of Dev Tools: AI Assistants and JavaScript Workflows - JSJ 686

In this episode of JavaScript Jabber, we sit down with Vinicius Dallacqua, a seasoned software engineer with a passion for performance and developer tooling. Vi

javascript-jabber
api tool
1.0.17

1.0.17

Chromaのリリース1.0.17では、いくつかの新機能とバグ修正が行われました。主な変更点には、スパンとメトリックエクスポータのためのメトリクスの追加、ディスパッチャ内の中止されたタスクの数を追跡するメトリックの追加、オプションを返すtake_result_channel()の改善が含まれます。また、ソフト削除されたコレクションのエラートレース機能の強化や、コレクションフォークのドキュメントの追加も行われました。さらに、DockerfileにAVX512命令を使用するフラグが追加され、メモリ使用量のピークを削減する改善も行われました。これらの変更は、Chromaのパフォーマンスと機能性を向上させることを目的としています。 • 新機能としてスパンとメトリックエクスポータのためのメトリクスが追加された • ディスパッチャ内の中止されたタスクの数を追跡するメトリックが追加された • take_result_channel()がオプションを返すように改善された • ソフト削除されたコレクションのエラートレース機能が強化された • コレクションフォークに関するドキュメントが追加された • DockerfileにAVX512命令を使用するフラグが追加された • メモリ使用量のピークを削減する改善が行われた

chroma-core/chroma
release tool
0.53.0

0.53.0

この記事は、OpenHandsプロジェクトのバージョン0.53.0のリリースに関するもので、主に新機能や変更点について説明しています。新たに、名前付きDockerボリュームのバインディングがランタイムに追加され、CLI設定の部分的な変更が許可されました。また、OpenHandsリゾルバに対してコード変更をプッシュするよう促す明示的な指示が追加されました。新しい貢献者も数名参加しており、彼らの初めての貢献が記載されています。 • 名前付きDockerボリュームのバインディングがランタイムに追加された • CLI設定の部分的な変更が許可された • OpenHandsリゾルバに対するコード変更のプッシュを促す指示が追加された • 新しい貢献者がプロジェクトに参加した • リリースは0.53.0で、いくつかのコミットが行われた

All-Hands-AI/OpenHands
release tool
No Image

Quoting Cory Doctorow

NERD HARDER! is the answer every time a politician gets a technological idée-fixe about how to solve a social problem by creating a technology that can't exist. It's the answer …

Simon Willison's Blog
security
Beyond billion-parameter burdens: Unlocking data synthesis with a conditional generator

Beyond billion-parameter burdens: Unlocking data synthesis with a conditional generator

この記事では、プライバシーを保護した合成データ生成のための新しいアルゴリズムCTCL(Data Synthesis with ConTrollability and CLustering)を提案しています。このアルゴリズムは、リソースが制約されたAIアプリケーションでも利用可能で、ビリオン規模の大規模言語モデル(LLM)を微調整することなく、トピック情報に基づいて合成データを生成します。CTCLは、140百万パラメータの軽量モデルを使用し、プライベートドメインのトピック分布に合った合成データを生成します。従来のAug-PEアルゴリズムと異なり、追加のプライバシーコストなしで無限の合成データサンプルを生成できる点が特徴です。CTCLは多様なデータセットで評価され、特に強いプライバシー保証の下でベースラインを一貫して上回る性能を示しました。 • プライバシーを保護した合成データ生成の課題を解決する新しいアルゴリズムCTCLを提案 • CTCLは140百万パラメータの軽量モデルを使用し、リソース制約のあるアプリケーションでも実用的 • トピック情報に基づいて合成データを生成し、プライベートドメインのトピック分布にマッチさせる • 従来の方法に比べて追加のプライバシーコストなしで無限の合成データを生成可能 • 多様なデータセットでの評価により、強いプライバシー保証の下での性能向上が確認された

Google Research
api tool
Scalable intelligent document processing using Amazon Bedrock Data Automation

Scalable intelligent document processing using Amazon Bedrock Data Automation

In the blog post Scalable intelligent document processing using Amazon Bedrock, we demonstrated how to build a scalable IDP pipeline using Anthropic foundation models on Amazon Bedrock. Although that approach delivered robust performance, the introduction of Amazon Bedrock Data Automation brings a new level of efficiency and flexibility to IDP solutions. This post explores how Amazon Bedrock Data Automation enhances document processing capabilities and streamlines the automation journey.

AWS Machine Learning Blog
api tool
Whiteboard to cloud in minutes using Amazon Q, Amazon Bedrock Data Automation, and Model Context Protocol

Whiteboard to cloud in minutes using Amazon Q, Amazon Bedrock Data Automation, and Model Context Protocol

We’re excited to share the Amazon Bedrock Data Automation Model Context Protocol (MCP) server, for seamless integration between Amazon Q and your enterprise data. In this post, you will learn how to use the Amazon Bedrock Data Automation MCP server to securely integrate with AWS Services, use Bedrock Data Automation operations as callable MCP tools, and build a conversational development experience with Amazon Q.

AWS Machine Learning Blog
cloud tool
No Image

Introducing Gemma 3 270M: The compact model for hyper-efficient AI

New from Google: Gemma 3 270M, a compact, 270-million parameter model designed from the ground up for task-specific fine-tuning with strong instruction-following and text structuring capabilities already trained in. This …

Simon Willison's Blog
framework tool
Bringing agentic Retrieval Augmented Generation to Amazon Q Business

Bringing agentic Retrieval Augmented Generation to Amazon Q Business

In this blog post, we explore how Amazon Q Business is transforming enterprise data interaction through Agentic Retrieval Augmented Generation (RAG).

AWS Machine Learning Blog
platform tool
Release v3.25.15

Release v3.25.15

RooCodeIncのGitHubリポジトリで公開されたリリースv3.25.15では、いくつかのバグ修正が行われた。具体的には、長い会話でのスクロールバーのジャンプを防ぐために500メッセージ制限が削除された。また、タスク切り替え時に凝縮状態をリセットする修正が加えられた。さらに、TypeScriptでのサイトマップ生成が実装され、XMLファイルが削除された。設定UIにおいてallowedMaxRequestsとallowedMaxCostの値が表示されない問題も修正された。 • 500メッセージ制限の削除により、長い会話でのスクロールバーのジャンプを防止 • タスク切り替え時に凝縮状態をリセットする修正 • TypeScriptでのサイトマップ生成の実装とXMLファイルの削除 • 設定UIにおけるallowedMaxRequestsとallowedMaxCostの値表示問題の修正

RooCodeInc/Roo-Code
release tool
Empowering students with disabilities: University Startups’ generative AI solution for personalized student pathways

Empowering students with disabilities: University Startups’ generative AI solution for personalized student pathways

University Startups, headquartered in Bethesda, MD, was founded in 2020 to empower high school students to expand their education beyond a traditional curriculum. University Startups is focused on special education and related services in school districts throughout the US. In this post, we explain how University Startups uses generative AI technology on AWS to enable students to design a specific plan for their future either in education or the work force.

AWS Machine Learning Blog
tool
Introducing Gemma 3 270M: The compact model for hyper-efficient AI

Introducing Gemma 3 270M: The compact model for hyper-efficient AI

Explore Gemma 3 270M, a compact, energy-efficient AI model for task-specific fine-tuning, offering strong instruction-following and production-ready quantization.

DeepMind Blog
tool
Citations with Amazon Nova understanding models

Citations with Amazon Nova understanding models

In this post, we demonstrate how to prompt Amazon Nova understanding models to cite sources in responses. Further, we will also walk through how we can evaluate the responses (and citations) for accuracy.

AWS Machine Learning Blog
api tool
AI personas you can use to support your entire UX process

AI personas you can use to support your entire UX process

Discover how AI personas can transform UX design, from simulating users to co-designing interfaces and boosting team speed and accuracy.

logrocket-dev
tool ui
AI dev tool power rankings & comparison [August 2025 edition]

AI dev tool power rankings & comparison [August 2025 edition]

Compare the top AI development tools and models of August 2025. See updated power rankings, feature-by-feature breakdowns, and find the right fit for your workflow.

logrocket-dev
tool
Flight Deals is our new, AI-powered flight search tool

Flight Deals is our new, AI-powered flight search tool

We’re introducing Flight Deals, a new, AI-powered search tool. Plus, there’s a new way to exclude basic economy on Google Flights.

Google AI Blog
api tool
Mastra Changelog 2025-08-14

Mastra Changelog 2025-08-14

This week we've shipped a major RAG enhancement with semantic markdown chunking and updated our A2A implementation to spec v0.3.0.

Mastra Blog
ai api cloud
You built the MCP server. Now track every client, tool, and request with Sentry.

You built the MCP server. Now track every client, tool, and request with Sentry.

Get full observability into your MCP server with a single line of code. Track usage, debug faster, and catch issues before your users do.

sentry-blog
api tool
0.6.5

0.6.5

この記事は、GitHub上のlangchain-ai/langgraphリポジトリのバージョン0.6.5のリリースノートを提供しています。このリリースでは、いくつかの重要な変更が行われました。まず、resume_mapの値を永続化する修正が含まれています。また、redisノードレベルのキャッシュを実装する新機能も追加されました。これにより、データのキャッシュ管理が向上し、パフォーマンスが改善されることが期待されます。 • resume_mapの値を永続化する修正が行われた • redisノードレベルのキャッシュが実装された • データのキャッシュ管理が向上する • パフォーマンスの改善が期待される

langchain-ai/langgraph
release tool
No Image

PyTorch Wheel Variants, the Frontier of Python Packaging

この記事では、PyTorchのパッケージングに関する問題と、Wheel Variantsの導入について説明しています。PyTorchは、AI製品の開発と展開において主要な機械学習フレームワークですが、パッケージングの難しさがユーザーにとっての大きな課題となっています。特に、異なるハードウェア向けにコンパイルされたPyTorchのインストール手順は複雑で、多くのステップを要します。これに対処するため、PyTorch 2.8ではWheel Variantsの実験的サポートが開始され、ユーザーのハードウェアに基づいて最適なPyTorchのバリアントを自動的にインストールできる機能が提供されます。この新しいアプローチは、Pythonパッケージングの未来において重要な役割を果たすと期待されています。 • PyTorchのパッケージングは難しく、特に異なるハードウェア向けのインストールが複雑である。 • Wheel Variantsは、ユーザーのハードウェアに基づいて最適なPyTorchのバリアントを自動的にインストールする機能を提供する。 • 現在のインストール手順は多くのステップを要し、ユーザーにとってフラストレーションの原因となっている。 • Wheel Variantsは、特定のハードウェアとソフトウェアのサポートを明示するための新しい方法として期待されている。 • この機能は実験的であり、PEPプロセスを通じて開発が進められている。

PyTorch Blog
library tool
Securely launch and scale your agents and tools on Amazon Bedrock AgentCore Runtime

Securely launch and scale your agents and tools on Amazon Bedrock AgentCore Runtime

In this post, we explore how Amazon Bedrock AgentCore Runtime simplifies the deployment and management of AI agents.

AWS Machine Learning Blog
cloud tool
cli-1.1.6

cli-1.1.6

この記事は、GitHub上のchroma-coreリポジトリにおけるcli-1.1.6のリリースに関する情報を提供しています。このリリースは2023年8月13日に行われ、GitHubの検証済み署名で作成されたことが記載されています。リリースには6つのアセットが含まれていることが示されていますが、具体的な内容や変更点については詳細が記載されていません。また、リリースに関連する通知設定の変更や、GitHubのアカウント切り替えに関する情報も含まれています。 • cli-1.1.6のリリース日が2023年8月13日であること • リリースはGitHubの検証済み署名で作成されたこと • リリースには6つのアセットが含まれているが、具体的な内容は不明であること • GitHub上での通知設定の変更に関する情報が含まれていること • アカウント切り替えに関する情報が記載されていること

chroma-core/chroma
release tool
Release v3.25.14

Release v3.25.14

この記事は、RooCodeIncのGitHubリポジトリにおけるリリースv3.25.14の内容を説明しています。このリリースでは、いくつかのバグ修正が行われました。具体的には、モデルがサポートする場合にのみ冗長性パラメータを含める修正、AWS Bedrockの1Mコンテキストに関する修正、リクエストのキャンセルをより迅速に行えるようにするための最近の変更の元に戻す修正が含まれています。これらの修正は、ユーザーの利便性を向上させることを目的としています。 • 冗長性パラメータをモデルがサポートする場合にのみ含める修正 • AWS Bedrockの1Mコンテキストに関する修正 • リクエストのキャンセルをより迅速に行えるようにする修正

RooCodeInc/Roo-Code
release tool
Google is investing in infrastructure and an AI-ready workforce in Oklahoma.

Google is investing in infrastructure and an AI-ready workforce in Oklahoma.

Google is investing an additional $9 billion in Oklahoma within the next two years in cloud and AI infrastructure. This investment supports the development of a new data…

Google AI Blog
cloud
PwC and AWS Build Responsible AI with Automated Reasoning on Amazon Bedrock

PwC and AWS Build Responsible AI with Automated Reasoning on Amazon Bedrock

This post presents how AWS and PwC are developing new reasoning checks that combine deep industry expertise with Automated Reasoning checks in Amazon Bedrock Guardrails to support innovation.

AWS Machine Learning Blog
framework tool
2025-08-12

2025-08-12

この記事は、Mastraの2025年8月12日のリリースに関するもので、主にエージェントのドキュメント更新やバグ修正、機能追加について述べています。具体的には、onChunkコールバックの追加、エージェントIDフィールドのバグ修正、エージェントモデルの更新機能、システムメモリメッセージの常時利用可能化が含まれています。また、QdrantとChromaベクターストアのメタデータフィルタリングテストが実施され、すべてのテストが成功したことが報告されています。CLIのツールバンドルロジックの調整や、Cloudflare Workerとの互換性向上、エラーチェックの強化も行われています。さらに、開発者ツールやUIの改善、MCPのスキーマ互換性ロジックの更新も含まれています。 • エージェントのドキュメントにonChunkコールバックを追加 • エージェントIDフィールドのバグ修正 • エージェントモデルの更新機能を追加 • システムメモリメッセージが常に利用可能に • QdrantとChromaのメタデータフィルタリングテストが成功 • CLIのツールバンドルロジックを調整し、テストファイルを除外 • Cloudflare Workerとの互換性を向上 • エラーチェックを強化し、バンドル失敗前にエラーを検出

mastra-ai/mastra
library release tool
Patch release 4.55.2: for FA2 users!

Patch release 4.55.2: for FA2 users!

この記事は、Hugging FaceのTransformersライブラリのパッチリリース4.55.2について説明しています。このリリースはFA2ユーザーに影響を与えるもので、前のリリース4.55.1において発生した問題を修正するためのものです。具体的には、gitのマージコンフリクトが原因で、必要なモジュールが欠落していたことが問題とされています。このリリースでは、FA2の生成に関する修正が行われ、今後の改善に向けたポストモーテムの作成が予定されています。 • FA2ユーザーに影響を与えるパッチリリースである • 前のリリース4.55.1における問題を修正 • gitのマージコンフリクトが原因で必要なモジュールが欠落していた • FA2の生成に関する修正が行われた • 今後の改善に向けたポストモーテムの作成が予定されている

huggingface/transformers
release tool
No Image

Screaming in the Cloud: AI’s Security Crisis: Why Your Assistant Might Betray You

I recorded this podcast conversation with Corey Quinn a few weeks ago: On this episode of Screaming in the Cloud, Corey Quinn talks with Simon Willison, founder of Datasette and …

Simon Willison's Blog
api security tool
How Amazon scaled Rufus by building multi-node inference using AWS Trainium chips and vLLM

How Amazon scaled Rufus by building multi-node inference using AWS Trainium chips and vLLM

In this post, Amazon shares how they developed a multi-node inference solution for Rufus, their generative AI shopping assistant, using Amazon Trainium chips and vLLM to serve large language models at scale. The solution combines a leader/follower orchestration model, hybrid parallelism strategies, and a multi-node inference unit abstraction layer built on Amazon ECS to deploy models across multiple nodes while maintaining high performance and reliability.

AWS Machine Learning Blog
framework tool
Build an intelligent financial analysis agent with LangGraph and Strands Agents

Build an intelligent financial analysis agent with LangGraph and Strands Agents

This post describes an approach of combining three powerful technologies to illustrate an architecture that you can adapt and build upon for your specific financial analysis needs: LangGraph for workflow orchestration, Strands Agents for structured reasoning, and Model Context Protocol (MCP) for tool integration.

AWS Machine Learning Blog
api cloud tool
Amazon Bedrock AgentCore Memory: Building context-aware agents

Amazon Bedrock AgentCore Memory: Building context-aware agents

In this post, we explore Amazon Bedrock AgentCore Memory, a fully managed service that enables AI agents to maintain both immediate and long-term knowledge, transforming one-off conversations into continuous, evolving relationships between users and AI agents. The service eliminates complex memory infrastructure management while providing full control over what AI agents remember, offering powerful capabilities for maintaining both short-term working memory and long-term intelligent memory across sessions.

AWS Machine Learning Blog
tool
How Does A Blind Model See The Earth?

How Does A Blind Model See The Earth?

Fun, creative new micro-eval. Split the world into a sampled collection of latitude longitude points and for each one ask a model: If this location is over land, say 'Land'. …

Simon Willison's Blog
platform
Build a conversational natural language interface for Amazon Athena queries using Amazon Nova

Build a conversational natural language interface for Amazon Athena queries using Amazon Nova

In this post, we explore an innovative solution that uses Amazon Bedrock Agents, powered by Amazon Nova Lite, to create a conversational interface for Athena queries. We use AWS Cost and Usage Reports (AWS CUR) as an example, but this solution can be adapted for other databases you query using Athena. This approach democratizes data access while preserving the powerful analytical capabilities of Athena, so you can interact with your data using natural language.

AWS Machine Learning Blog
api cloud tool
Agent Factory: The new era of agentic AI—common use cases and design patterns

Agent Factory: The new era of agentic AI—common use cases and design patterns

Instead of simply delivering information, agents reason, act, and collaborate—bridging the gap between knowledge and outcomes. Learn more about agentic AI in Azure AI Foundry.

Microsoft AI Blog
api cloud tool
0.52.0 - 2025-08-13

0.52.0 - 2025-08-13

この記事は、OpenHandsのバージョン0.52.0のリリースノートを提供しています。このリリースでは、いくつかの新機能と改善が追加されました。具体的には、qwen-3-coder-480bとgpt-5-2025-08-07モデルのサポートが追加され、CLIを使用してOpenHands UIを起動する機能が実装されました。また、Dockerランタイムでのオーバーレイマウントのサポートや、OpenHands Cloudでの追加の解決可能性分析を有効または無効にするスイッチも追加されました。さらに、CLIインターフェースの改善や、会話履歴の制限が20から100に変更されるなどの改良も行われました。バグ修正としては、ユーザー入力コマンドがターミナルで二重にエコーされる問題や、Windowsプラットフォームでの一貫性のためのシステムプロンプトの修正が含まれています。 • 新機能としてqwen-3-coder-480bとgpt-5-2025-08-07モデルのサポートが追加された。 • CLIを使用してOpenHands UIを起動する機能が実装された。 • Dockerランタイムでのオーバーレイマウントのサポートが追加された。 • OpenHands Cloudでの追加の解決可能性分析を有効または無効にするスイッチが追加された。 • 会話履歴の制限が20から100に変更された。 • ユーザー入力コマンドがターミナルで二重にエコーされる問題が修正された。 • Windowsプラットフォームでの一貫性のためにシステムプロンプトが修正された。

All-Hands-AI/OpenHands
api release tool
How Coxwave delivers GenAI value faster with Vercel

How Coxwave delivers GenAI value faster with Vercel

Coxwave's journey to cutting deployment times by 85% and building AI-native products faster with Vercel

Vercel Blog
api framework tool
Patch release 4.55.1

Patch release 4.55.1

この記事は、Hugging FaceのTransformersライブラリのパッチリリース4.55.1について説明しています。このリリースは主にGPTOSSモデルのMxfp4の安定化に焦点を当てています。具体的な修正内容には、Idefics2およびIdefics3のテンソルデバイス問題の修正、CPUデバイスマップにおけるデフォルトのデクオンタイズ設定、GPT Big Codeの注意スケーリングの修正、Windows互換性の向上、Gemma3nモデルのプレースホルダーマスクのデフォルト値の追加、Fuyuモデルの画像推論の修正、PerceptionLMのビデオ入力の修正、Ideficsのデバイス不一致の修正、Tritonカーネルの依存関係の削除、古いハードウェアでのGPT-OSS MXFP4の有効化、CPU推論のためのデクオンタイズオプションの許可などが含まれています。CIの安定性向上のための修正も行われています。 • GPTOSSモデルのMxfp4の安定化に焦点を当てたリリース • Idefics2、Idefics3のテンソルデバイス問題を修正 • CPUデバイスマップでのデフォルトデクオンタイズ設定の追加 • GPT Big Codeの注意スケーリングを修正 • Windows互換性の向上 • Gemma3nモデルのプレースホルダーマスクのデフォルト値を追加 • Fuyuモデルの画像推論を修正 • PerceptionLMのビデオ入力の修正 • Ideficsのデバイス不一致を修正 • Tritonカーネルの依存関係を削除 • 古いハードウェアでのGPT-OSS MXFP4の有効化 • CPU推論のためのデクオンタイズオプションを許可 • CIの安定性向上のための修正

huggingface/transformers
release tool
simonw/codespaces-llm

simonw/codespaces-llm

GitHub Codespaces provides full development environments in your browser, and is free to use with anyone with a GitHub account. Each environment has a full Linux container and a browser-based …

Simon Willison's Blog
api tool