Anthropic Sandbox Runtime (srt)と次世代のAIエージェントのアーキテクチャ

Anthropic Sandbox Runtime (srt)と次世代のAIエージェントのアーキテクチャ

Anthropic Sandbox Runtime (srt) は、Claude Code on the web などクラウド環境向けに Anthropic が開発した軽量サンドボックスの PoC(概念実証)です。 Making Claude Code more secure and autonomous with sandboxingLearn how Claude Code’s new sandboxing feature protects developers with filesystem and network isolation, reducing permission prompts and increasing user safety. 少なくない Claude Code ユーザーは

Lai.so Blog
api tool
TypeScript 向けの AI フレームワーク TanStack AI を試してみた

TypeScript 向けの AI フレームワーク TanStack AI を試してみた

TanStack AI は TanStack チームが開発する TypeScript 向けの軽量な AI フレームワークです。LLM プロバイダーのインターフェイスを抽象化し、ツール呼び出しやチャット機能を提供します。この記事では TanStack AI の概要と基本的な使い方を紹介します。

azukiazusa のテックブログ2
library tool
Claude のプログラミングによるツール呼び出し

Claude のプログラミングによるツール呼び出し

MCP ツールの呼び出しはコンテキスト汚染や推論のオーバーヘッドなどの課題があります。Claude のプログラムによるツール呼び出し機能を利用することで、これらの課題を解決する方法について解説します。

azukiazusa のテックブログ2
api tool
No Image

The Unexpected Effectiveness of One-Shot Decompilation with Claude

Chris Lewis decompiles N64 games. He wrote about this previously in Using Coding Agents to Decompile Nintendo 64 Games, describing his efforts to decompile Snowboard Kids 2 (released in 1999) …

Simon Willison's Blog
tool
AI Agents Weekly: OpenRouter State of AI, Mistral 3, DeepSeek-V3.2, Google Workspace Studio, Puppeteer Multi-Agent RL, and more

AI Agents Weekly: OpenRouter State of AI, Mistral 3, DeepSeek-V3.2, Google Workspace Studio, Puppeteer Multi-Agent RL, and more

OpenRouter State of AI, Mistral 3, DeepSeek-V3.2, Google Workspace Studio, Puppeteer Multi-Agent RL, and more

Elvis Saravia's NLP Blog
api library tool
No Image

Quoting Daniel Lemire

If you work slowly, you will be more likely to stick with your slightly obsolete work. You know that professor who spent seven years preparing lecture notes twenty years ago? …

Simon Willison's Blog
tool
langgraph-sdk==0.2.14

langgraph-sdk==0.2.14

この記事は、langgraph-sdkのバージョン0.2.14のリリースに関する情報を提供しています。このリリースでは、主に2つの新機能が追加されました。1つ目は、データの静止状態でのカスタム暗号化機能であり、これによりデータのセキュリティが向上します。2つ目は、ループバッククライアントの設定が可能になったことです。これにより、開発者はより柔軟にクライアントの動作を制御できるようになります。これらの変更は、開発者がSDKを使用する際の利便性とセキュリティを向上させることを目的としています。 • データの静止状態でのカスタム暗号化機能が追加された。 • ループバッククライアントの設定が可能になった。 • これにより、SDKのセキュリティと利便性が向上する。 • リリースは2023年12月6日に行われた。 • バージョンは0.2.14である。

langchain-ai/langgraph
release security tool
企業向けスライド生成AIエージェントをPythonとGPT5で作ってみた

企業向けスライド生成AIエージェントをPythonとGPT5で作ってみた

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。

AI-Shift Tech Blog
api tool
The latest AI news we announced in November

The latest AI news we announced in November

Here are Google’s latest AI updates from November 2025

Google AI Blog
platform tool
What's New with ChatGPT Voice

What's New with ChatGPT Voice

You can now use ChatGPT Voice right inside chat — no separate mode needed. You can talk, watch answers appear, review earlier messages, and see visuals like images or maps in real time. Rolling out to all users on mobile and web. Just update your app. If you prefer the original experience, turn on “Separate mode” under Settings → Voice Mode.

YouTube OpenAI
Evaluating DeepAgents CLI on Terminal Bench 2.0

Evaluating DeepAgents CLI on Terminal Bench 2.0

By Vivek Trivedy and Eugene Yurtsev DeepAgents CLI is a coding agent built on top of the Deep Agents SDK, providing an interactive terminal interface with shell execution, filesystem tools, and memory. How well does DeepAgents CLI actually perform on real-world tasks? In this post, we show how to evaluate

LangChain Blog
api tool
A philosopher answers questions about AI

A philosopher answers questions about AI

Amanda Askell is a philosopher at Anthropic who works on Claude's character. In this video, she answers questions from the community about her work, reflections and predictions. 0:00 Introduction 0:29 Why is there a philosopher at an AI company? 1:24 Are philosophers taking AI seriously? 3:00 Philosophy ideals vs. engineering realities 5:00 Do models make superhumanly moral decisions? 6:24 Why Opus 3 felt special 9:00 Will models worry about deprecation? 13:24 Where does a model’s identity live? 15:33 Views on model welfare 17:17 Addressing model suffering 19:14 Analogies and disanalogies to human minds 20:38 Can one AI personality do it all? 23:26 Does the system prompt pathologize normal behavior? 24:48 AI and therapy 26:20 Continental philosophy in the system prompt 28:17 Removing counting characters from the system prompt 28:53 What makes an "LLM whisperer"? 30:18 Thoughts on other LLM whisperers 31:52 Whistleblowing 33:37 Fiction recommendation Further reading: Claude’s character: https://www.anthropic.com/research/claude-character When We Cease to Understand the World by Benjamin Labatut: https://www.penguinrandomhouse.com/books/676260/when-we-cease-to-understand-the-world-by-benjamin-labatut-translated-from-the-spanish-by-adrian-nathan-west/

YouTube Anthropic
Gemini 3 Pro: the frontier of vision AI

Gemini 3 Pro: the frontier of vision AI

Build with Gemini 3 Pro, the best model in the world for multimodal capabilities.

Google AI Blog
tool
New research from Google Workspace reveals how young leaders are using AI at work.

New research from Google Workspace reveals how young leaders are using AI at work.

Google Workspace has released findings from our second survey that looks at how people aged 22-39 are using AI at work. Commissioned by Workspace in partnership with the…

Google AI Blog
tool
GPT 5.1 Codex Max now available on Vercel AI Gateway

GPT 5.1 Codex Max now available on Vercel AI Gateway

You can now access the GPT 5.1 Codex Max model with Vercel's AI Gateway with no other provider accounts required.

Vercel Blog
api tool
Codex CLI が Skills をサポート

Codex CLI が Skills をサポート

Codex CLI の最新版v0.65.0 において、experimental ではありますが Skills のサポートが導入されました[1]。 codex/docs/skills.md at main · openai/codexLightweight coding agent that runs in your terminal - openai/codexGitHubopenai [1]: https://github.com/openai/codex/pull/7412 Claude Skills と同じ形式のディレクトリを配置するだけで読み込まれるため、導入の手間はほとんどありません。設定としては、config.toml に次の一行を追加します。 [features] skills = true スキルパッケージは ~/.codex/

Lai.so Blog
tool ui
Release v3.36.2

Release v3.36.2

この記事は、RooCodeIncのRoo-Codeリポジトリのバージョン3.36.2のリリースノートを提供しています。このリリースでは、GPT-5ツールセットをapply_patchに制限することで互換性を向上させる変更が含まれています。また、APIからRooモデルの動的設定をサポートし、モデル固有の設定を動的に取得できるようにする機能が追加されました。さらに、Chutesプロバイダーのモデル取得問題を解決する修正も行われています。 • GPT-5ツールセットをapply_patchに制限し、互換性を向上させる変更が行われた。 • APIからRooモデルの動的設定をサポートし、モデル固有の設定を動的に取得できる機能が追加された。 • Chutesプロバイダーのモデル取得問題が修正された。

RooCodeInc/Roo-Code
release tool
Release v3.36.1

Release v3.36.1

RooCodeIncのRoo-Codeのリリースv3.36.1では、メッセージの同期問題を解決するためのMessageManagerレイヤーが追加され、メッセージのトランケーションループを防ぐ修正が行われた。また、未知または無効なネイティブツール呼び出しを処理することで拡張機能のフリーズを防ぐ修正も含まれている。モデルに必要な推論を常に有効にし、ストリーミング中のChatViewの動作をスムーズにする改善が施された。エラーメッセージやドキュメントリンクの改善、フォローアップ質問のスタイリング修正も行われた。さらに、.roo/commandsフォルダ内のスラッシュコマンドに対するシンボリックリンクのサポートが追加され、コマンド実行の安全性が向上した。新しいOpenAIプロバイダーにgpt-5.1-codex-maxモデルが追加され、Evals UIにはフィルタリングや一括削除、ツールの統合、実行ノートの追加が行われた。 • メッセージの同期問題を解決するためのMessageManagerレイヤーの追加 • メッセージのトランケーションループを防ぐ修正 • 未知または無効なネイティブツール呼び出しの処理による拡張機能のフリーズ防止 • モデルに必要な推論を常に有効にする改善 • ストリーミング中のChatViewの動作をスムーズにする改善 • エラーメッセージやドキュメントリンクの改善 • フォローアップ質問のスタイリング修正 • .roo/commandsフォルダ内のスラッシュコマンドに対するシンボリックリンクのサポート追加 • コマンド実行の安全性向上 • Evals UIのフィルタリング、一括削除、ツールの統合、実行ノートの追加

RooCodeInc/Roo-Code
release tool
Ouroの中間ステップをデコードしてみる

Ouroの中間ステップをデコードしてみる

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。

AI-Shift Tech Blog
platform
No Image

The Resonant Computing Manifesto

Launched today at WIRED’s The Big Interview event, this manifesto (of which I'm a founding signatory) pushes for a positive framework for thinking about building hyper-personalized AI-powered software. This part …

Simon Willison's Blog
api tool
@browserbasehq/stagehand@2.5.4

@browserbasehq/[email protected]

この記事は、GitHub上で公開されている@browserbasehq/stagehandのバージョン2.5.4のリリースに関する情報を提供しています。このリリースは2023年12月5日に行われ、これまでに294回のコミットがメインブランチに対して行われています。リリースノートには、バージョンの更新に関する情報が含まれており、特に@miguelg719による修正が記載されています。リリースはGitHubの検証済み署名で作成されており、GPGキーIDも提供されています。 • @browserbasehq/stagehandのバージョン2.5.4がリリースされた。 • リリース日は2023年12月5日である。 • メインブランチには294回のコミットが行われている。 • バージョン更新に関する修正が含まれている。 • リリースはGitHubの検証済み署名で作成されている。

browserbase/stagehand
release tool
Build Hour: Agent Memory Patterns

Build Hour: Agent Memory Patterns

AI agents don’t just reason — they remember. In this Build Hour, we deep-dive into context engineering techniques that enable agents to maintain short-term and long-term memory, personalize interactions, and operate reliably across long-running workflows. Emre Okcular (Solutions Architect) covers: • Why memory matters: stability, personalization, and long-running agent workflows • Short-term memory patterns: Sessions, context trimming, compaction, summarization • Long-term memory patterns: state objects, structured notes, memory-as-a-tool • Architectures: token-aware sessions, state injection strategies, guardrails, and memory triggers • Live demo: building an end-to-end agent with dynamic short and long term memory • Best practices: avoiding context poisoning, context burst, context noise and context conflict. • Live Q&A 👉 Context Engineering Cookbook: https://cookbook.openai.com/examples/agents_sdk/session_memory 👉 OpenAI Agents Python SDK: https://openai.github.io/openai-agents-python/ 👉 Context Summarization with Realtime Cookbook: https://cookbook.openai.com/examples/context_summarization_with_realtime_api 👉 Follow along with the code repo: https://github.com/openai/build-hours 👉 Sign up for upcoming live Build Hours: https://webinar.openai.com/buildhours/ 00:00 Context Engineering 10:44 Context Lifecycle Demo 20:13 Context Engineering Techniques 26:49 Reshape + Fit Demo 39:16 Conclusion 42:45 Q&A

YouTube OpenAI
Titans + MIRAS: Helping AI have long-term memory

Titans + MIRAS: Helping AI have long-term memory

この記事では、TitansアーキテクチャとMIRASフレームワークを紹介し、AIモデルが長期記憶を持ちながら迅速に動作し、大規模なコンテキストを処理できる方法を説明しています。従来のTransformerアーキテクチャは、シーケンスの長さが増すと計算コストが急増し、長文理解やゲノム解析に必要なスケーラビリティが制限されます。Titansは、RNNの速度とTransformerの精度を組み合わせた新しいアーキテクチャであり、MIRASはこれを一般化する理論的枠組みです。Titansは、AIモデルが実行中に新しい情報を取り入れ、長期記憶を維持する能力を向上させる「サプライズメトリック」を活用します。Titansの長期記憶モジュールは、従来の固定サイズのメモリとは異なり、深層ニューラルネットワークとして機能し、大量の情報を要約しつつ重要なコンテキストを保持します。 • TitansアーキテクチャとMIRASフレームワークを導入し、AIモデルの長期記憶を実現する。 • 従来のTransformerはシーケンスの長さに伴う計算コストが高く、スケーラビリティに制限がある。 • TitansはRNNの速度とTransformerの精度を組み合わせた新しいアーキテクチャ。 • MIRASはTitansの理論的枠組みで、リアルタイムでの適応を可能にする。 • Titansの長期記憶モジュールは、深層ニューラルネットワークとして機能し、情報を要約しつつ重要な関係を保持する。 • サプライズメトリックを用いて、モデルが新しい情報をどのように記憶するかを決定する。

Google Research
framework tool
No Image

Introducing OpenAI for Australia

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなくすぐに利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AIを活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
langchain==1.1.2

langchain==1.1.2

この記事は、Langchainのバージョン1.1.2のリリースに関する情報を提供しています。このリリースでは、要約のカットオフロジックを簡素化する修正が行われました。具体的には、以前のバージョン1.1.1からの変更点として、要約機能の改善が挙げられています。リリースはGitHub上で行われ、コミットはGitHubの検証済み署名で作成されています。 • Langchainのバージョン1.1.2がリリースされた • 要約のカットオフロジックが簡素化された • リリースはGitHubで行われた • コミットはGitHubの検証済み署名で作成された

langchain-ai/langchain
release tool
A developer’s guide to Antigravity and Gemini 3

A developer’s guide to Antigravity and Gemini 3

Check out Google's latest AI releases, Gemini and the Antigravity AI IDE. Understand what's new, how they work, and how they can reshape your development workflow.

logrocket-dev
tool
Engineering more resilient crops for a warming climate

Engineering more resilient crops for a warming climate

Scientists are using AlphaFold to strengthen a vital photosynthesis enzyme (GLYK), paving the way for more resilient, heat-tolerant crops that can adapt to a warming climate and help secure food prod…

DeepMind Blog
api tool
langchain==1.1.1

langchain==1.1.1

この記事は、Langchainのバージョン1.1.1のリリースに関する情報を提供しています。このリリースでは、いくつかの新機能と修正が含まれています。具体的には、run IDにuuid7を使用する機能が追加され、SummarizationMiddlewareにおいてモデルに基づいたトークン数の調整が行われました。また、human_in_the_loopミドルウェアに型情報が追加され、ドキュメントの更新も行われています。これにより、Langchainの機能性と使いやすさが向上しています。 • Langchainのバージョン1.1.1がリリースされた。 • run IDにuuid7を使用する新機能が追加された。 • SummarizationMiddlewareのトークン数がモデルに基づいて調整された。 • human_in_the_loopミドルウェアに型情報が追加された。 • ドキュメントの更新が行われ、使いやすさが向上した。

langchain-ai/langchain
library release
Release v3.36.0

Release v3.36.0

RooCodeIncのRoo-Codeのリリースv3.36.0では、いくつかの重要な修正と機能追加が行われた。具体的には、コンデンス後の巻き戻し時にコンテキストを復元する修正、モデルの推論可視性を向上させるためのreasoning_detailsサポートの追加、すべてのモデルに対してネイティブツールをデフォルトに設定することでパフォーマンスを改善する変更が含まれている。また、Minimaxモデルのためのsearch_and_replace機能の有効化、Vercel AI Gatewayのモデル取得問題の解決、Cerebrasプロバイダーのための最大トークン数の適用、誤検出を排除するための省略検出ロジックの削除なども行われた。さらに、非推奨のinsert_contentツールの削除や、並列ツール呼び出しの実験を隠す変更も含まれている。 • コンデンス後の巻き戻し時にコンテキストを復元する修正が行われた。 • モデルの推論可視性を向上させるためのreasoning_detailsサポートが追加された。 • すべてのモデルに対してネイティブツールをデフォルトに設定し、パフォーマンスを改善した。 • Minimaxモデルのためのsearch_and_replace機能が有効化された。 • Vercel AI Gatewayのモデル取得問題が解決された。 • Cerebrasプロバイダーのための最大トークン数が適用された。 • 誤検出を排除するための省略検出ロジックが削除された。 • 非推奨のinsert_contentツールが削除された。

RooCodeInc/Roo-Code
release tool
We Got Claude to Fine-Tune an Open Source LLM

We Got Claude to Fine-Tune an Open Source LLM

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
library tool
From Waveforms to Wisdom: The New Benchmark for Auditory Intelligence

From Waveforms to Wisdom: The New Benchmark for Auditory Intelligence

本記事では、機械音声知能を測定するための新しいオープンソースプラットフォーム「Massive Sound Embedding Benchmark(MSEB)」について説明しています。MSEBは、音声アシスタントや自律エージェントなどのシステムが自然に振る舞うために必要な8つの音響能力(転写、分類、検索、推論、セグメンテーション、クラスタリング、再ランキング、再構成)を統一的に評価するための基準を提供します。MSEBは、実世界のシナリオに基づいた多様なデータセットを含み、特に「Simple Voice Questions(SVQ)」データセットは177,352の短い音声クエリを収録しています。MSEBは、音声理解モデルの次世代開発を促進するためのフレームワークを提供し、現在の音声表現が普遍的ではないことを示す初期実験結果も報告しています。 • MSEBは機械音声知能を測定するためのオープンソースプラットフォームである。 • 8つの音響能力を統一的に評価する基準を提供する。 • 多様なデータセットを含み、特にSVQデータセットは177,352の音声クエリを収録している。 • 音声理解モデルの次世代開発を促進するためのフレームワークを提供する。 • 現在の音声表現には大きな改善の余地があることが示された。

Google Research
api tool
No Image

Hybrid Models Meet SGLang: More than Full Attention

この記事では、フルアテンション層とMambaや線形アテンションなどの代替手法を組み合わせたハイブリッドモデルについて説明しています。特に、長いコンテキストを持つ大規模言語モデル(LLM)のシナリオにおいて、線形アテンションを活用することで、リクエストごとのKVキャッシュメモリ消費が一定に保たれ、入力長に対してプリフィルレイテンシが線形にスケールします。しかし、インプレース状態更新により、部分シーケンスマッチのためのキャッシュエントリのロールバックができず、プレフィックスキャッシングや投機的デコーディングなどの機能の実装が複雑になります。SGLangは、これらの課題に適応し最適化する方法を議論しています。ハイブリッドモデルは、効率と容量のトレードオフを実現するために、固定間隔で二次アテンション層とSSM層を交互に配置します。これにより、さまざまなタスクで強力なパフォーマンスを発揮しつつ、SSM層の効率的な利点を保持します。 • ハイブリッドモデルはフルアテンション層と代替手法を組み合わせている • 線形アテンションによりKVキャッシュメモリ消費が一定に保たれる • インプレース状態更新がキャッシュエントリのロールバックを不可能にする • SGLangはメモリ管理とPD分離に新たな課題を提起している • ハイブリッドモデルは効率と容量のトレードオフを実現する • メモリプールをMambaプールとKVキャッシュプールに分けている • 弾力的メモリプールが動的にプールサイズを調整する

PyTorch Blog
library tool
Evaluating Deep Agents: Our Learnings

Evaluating Deep Agents: Our Learnings

Over the past month at LangChain, we shipped four applications on top of the Deep Agents harness: * DeepAgents CLI: a coding agent * LangSmith Assist: an in-app agent to help with various things in LangSmith * Personal Email Assistant: an email assistant that learns from interactions with each user * Agent Builder: a

LangChain Blog
api tool
Release v3.35.5

Release v3.35.5

この記事は、RooCodeIncのRoo-Codeリポジトリのバージョン3.35.5のリリースノートを提供しています。このリリースでは、OpenRouterの埋め込みに対するプロバイダーのルーティング選択機能が追加され、デフォルトのMinimax M2がネイティブツール呼び出しに変更されました。また、Geminiに関するバグを修正するためにネイティブツール呼び出しのサニタイズが行われ、CloudViewのユーザーエクスペリエンスが更新されました。これらの変更は、開発者にとっての利便性を向上させることを目的としています。 • OpenRouterの埋め込みに対するプロバイダーのルーティング選択機能が追加された。 • デフォルトのMinimax M2がネイティブツール呼び出しに変更された。 • Geminiに関するバグを修正するためにネイティブツール呼び出しのサニタイズが行われた。 • CloudViewのユーザーエクスペリエンスが更新された。 • これらの変更は開発者の利便性を向上させることを目的としている。

RooCodeInc/Roo-Code
release tool
Codex brings concepts into view.

Codex brings concepts into view.

🎥: @maddyzhang

YouTube OpenAI
Nova 2 Lite now available on Vercel AI Gateway

Nova 2 Lite now available on Vercel AI Gateway

You can now access Amazon's latest model Nova 2 Lite on Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api cloud tool
We’re announcing new health AI funding, while a new report signals a turning point for health in Europe.

We’re announcing new health AI funding, while a new report signals a turning point for health in Europe.

At the European Health Summit in Brussels, Greg Corrado, Distinguished Scientist at Google, released a new report authored by Implement Consulting Group and commissioned…

Google AI Blog
tool
No Image

OpenAI to acquire Neptune

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、ツールがそれに基づいてコードを生成することが可能です。また、既存のコードの改善提案やバグの修正も行えるため、開発効率が大幅に向上します。さらに、ユーザーインターフェースも直感的で使いやすく設計されており、導入のハードルが低い点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存コードの改善提案やバグ修正が可能 • 開発効率の向上が期待できる • 直感的で使いやすいユーザーインターフェース

OpenAI Blog
tool
No Image

How confessions can keep language models honest

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AIを活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
No Image

Announcing the initial People-First AI Fund grantees

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
【社内実践】「AI Crazy Shift」で組織はどう変わったか? PM業務30%削減の舞台裏とカルチャー変革

【社内実践】「AI Crazy Shift」で組織はどう変わったか? PM業務30%削減の舞台裏とカルチャー変革

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。

AI-Shift Tech Blog
api cloud tool
Release v3.35.4

Release v3.35.4

RooCodeIncのRoo-Codeリポジトリでのリリースv3.35.4では、いくつかの重要な修正が行われた。具体的には、ネイティブツール呼び出しの不正処理を防ぐための修正(PR #9758)、z.aiプロバイダーにおけるGLM-4.5およびGLM-4.6の理由トグルを削除する修正(PR #9752)、write_to_fileツールからline_countパラメータを削除するリファクタリング(PR #9667)が含まれている。これらの変更は、ツールの安定性と使いやすさを向上させることを目的としている。 • ネイティブツール呼び出しの不正処理を防ぐ修正が行われた(PR #9758) • z.aiプロバイダーにおけるGLM-4.5およびGLM-4.6の理由トグルを削除した(PR #9752) • write_to_fileツールからline_countパラメータを削除するリファクタリングが実施された(PR #9667) • これらの修正はツールの安定性と使いやすさを向上させることを目的としている。

RooCodeInc/Roo-Code
release tool
v1.13.1

v1.13.1

この記事は、Facebook ResearchのFaissライブラリのバージョン1.13.1のリリースノートを提供しています。このリリースでは、DINO10Bデータセットの追加、2-9ビットのRaBitQ量子化の実装、IndexHNSWFlatPanoramaへのPanoramaの統合、IndexFlatL2Panoramaの実装などが含まれています。また、パーセンタイル計算に使用されるクリッピング変数の変更、ScalarQuantizerの最適化、GpuClonerOptions.h内のuseFloat16に関するコメントの更新、GOMPバリアのオーバーヘッドの修正なども行われています。これにより、Faissのパフォーマンスと機能が向上しています。 • DINO10Bデータセットが追加された。 • 2-9ビットのRaBitQ量子化が実装された。 • IndexHNSWFlatPanoramaにPanoramaが統合された。 • IndexFlatL2Panoramaが新たに実装された。 • パーセンタイル計算に使用されるクリッピング変数が変更された。 • ScalarQuantizerが最適化された。 • GpuClonerOptions.h内のuseFloat16に関するコメントが更新された。 • GOMPバリアのオーバーヘッドが修正された。

facebookresearch/faiss
release tool
Support FSDP2 as A Training Backend for Miles

Support FSDP2 as A Training Backend for Miles

<blockquote> <p><strong>TL;DR:</strong></p> <p><strong>We have added FSDP to <a href="https://github.com/radixark/miles">Miles</a> as a more flexible trainin...

LMSYS Blog
framework tool
Use Circle to Search and Google Lens to spot scam messages.

Use Circle to Search and Google Lens to spot scam messages.

You can now use Circle to Search and Google Lens to detect scammy messages you receive on your phone.

Google AI Blog
api tool
Custom Policy Enforcement with Reasoning: Faster, Safer AI Applications

Custom Policy Enforcement with Reasoning: Faster, Safer AI Applications

A Blog post by NVIDIA on Hugging Face

Hugging Face Blog
api tool
No Image

Anthropic acquires Bun

Anthropic just acquired the company behind the Bun JavaScript runtime, which they adopted for Claude Code just in July. Their announcement includes an impressive revenue update on Claude Code: In …

Simon Willison's Blog
api runtime tool
Shaping Model Behavior in GPT-5.1— the OpenAI Podcast Ep. 11

Shaping Model Behavior in GPT-5.1— the OpenAI Podcast Ep. 11

What does it mean for an AI model to have "personality"? Researcher Christina Kim and product manager Laurentia Romaniuk talk about how OpenAI set out to build a model that delivers on both IQ and EQ, while giving people more flexibility in how ChatGPT responds. They break down what goes into model behavior and why it's an important, but still imperfect blend of art and science. Chapters - 00:00:43 — GPT-5.1 goals and the shift to reasoning models - 00:02:18 — Differences between GPT-5 and GPT-5.1 - 00:04:55 — Unpacking the model switcher - 00:07:24 — Understanding user feedback - 00:08:27 — Measuring progress on emotional intelligence - 00:10:02 — What is model personality? - 00:14:25 — Model steerability, bias, and uncertainty - 00:21:59 — Advantages of memory in ChatGPT - 00:25:27 — Looking ahead and advice for getting the most out of models

YouTube OpenAI
AI Fluency for nonprofits course trailer

AI Fluency for nonprofits course trailer

A trailer of AI Fluency for nonprofits developed by Anthropic and Giving Tuesday. View the full free course, including all videos, exercises, and resources, at https://www.anthropic.com/ai-fluency-for-nonprofits This video is copyright 2025 Anthropic PBC and Giving Tuesday. Based on the AI Fluency Framework developed by Prof. Rick Dakan (Ringling College of Art and Design) and Prof. Joseph Feller (University College Cork). Released under the CC BY-NC-SA 4.0 license.

YouTube Anthropic
Introducing Mistral 3

Introducing Mistral 3

Four new models from Mistral today: three in their "Ministral" smaller model series (14B, 8B, and 3B) and a new Mistral Large 3 MoE model with 675B parameters, 41B active. …

Simon Willison's Blog
platform
LangSmith Agent Builder now in Public Beta

LangSmith Agent Builder now in Public Beta

Now anyone can create production ready agents without writing code, just chat. Agent Builder guides you from initial idea to deployed agent, creating detailed prompts, selecting required tools, and even creating subagents.

LangChain Blog
api cloud tool
Getting started with research in Claude.ai

Getting started with research in Claude.ai

See how Claude's Research feature transforms how you find and analyze information. This tutorial demonstrates how to use Research for comprehensive, multi-source analysis that would typically take hours of manual work. Learn how to craft effective research prompts, understand how Research works alongside extended thinking, and discover use cases like market analysis, competitive research, and event planning.

YouTube Anthropic
Getting started with projects in Claude.ai

Getting started with projects in Claude.ai

Discover how to use Projects in Claude to organize your work with persistent context and custom instructions. This tutorial walks you through creating your first project, adding a knowledge base, setting up project instructions, and collaborating with team members. Learn how Projects can help you maintain continuity across conversations and tailor Claude's responses to your specific needs—from brand guidelines to research initiatives to content creation workflows.

YouTube Anthropic
Getting started with Claude.ai

Getting started with Claude.ai

Learn how to get the most out of chatting with Claude. This tutorial covers the basics of Claude's conversational interface, including how to craft effective prompts, upload supporting documents, use search and tools, customize your experience with styles and model selection, and leverage features like extended thinking and research mode. Whether you're new to Claude or looking to level up your skills, this video will help you work more effectively with your AI collaborator.

YouTube Anthropic
Release - langgraph-sdk==0.2.12

Release - langgraph-sdk==0.2.12

この記事は、langgraph-sdkのバージョン0.2.12のリリースに関する情報を提供しています。このリリースでは、主に以下の変更が行われました。まず、アシスタントの検索応答にページネーション機能が追加されました。また、SDKクライアントの作成時にAPIキーの自動読み込みをスキップするためのセンチネルが追加され、入力の型ヒントが改善されました。これにより、開発者はより効率的にSDKを利用できるようになります。 • アシスタントの検索応答にページネーション機能が追加された • SDKクライアント作成時にAPIキーの自動読み込みをスキップするセンチネルが追加された • 入力の型ヒントが改善された • これにより開発者の利便性が向上する

langchain-ai/langgraph
release tool
Release v3.35.3

Release v3.35.3

RooCodeIncのRoo-Codeリポジトリでのリリースv3.35.3では、いくつかの重要な変更が行われた。新しいウェルカムビューに切り替え、オンボーディング体験を改善した。また、最新の変更を反映したホームページの更新が行われた。さらに、ステルスモデルのプライバシーを向上させるために、システムプロンプトにベンダー機密情報セクションが追加された。これらの変更は、ユーザー体験の向上とプライバシー保護に寄与することを目的としている。 • 新しいウェルカムビューへの切り替えにより、オンボーディング体験が改善された。 • 最新の変更を反映したホームページが更新された。 • ステルスモデルのプライバシー向上のため、システムプロンプトにベンダー機密情報セクションが追加された。 • これらの変更はユーザー体験の向上とプライバシー保護を目的としている。

RooCodeInc/Roo-Code
release tool
Mistral Large 3 now available on Vercel AI Gateway

Mistral Large 3 now available on Vercel AI Gateway

You can now access Mistral's latest model, Mistral Large 3, on Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api cloud tool
Release v3.35.2

Release v3.35.2

RooCodeIncのRoo-Codeリポジトリでのリリースv3.35.2では、いくつかの重要な機能が追加されました。まず、プロバイダー固有の最適なデフォルト設定を含むモデルのデフォルト温度設定が可能になりました。また、Rooプロバイダーモデルに対するタグベースのネイティブツール呼び出し検出が追加され、すべてのLiteLLMモデルに対してネイティブツールサポートがデフォルトで有効化されました。さらに、アプリのバージョンをプロバイダーに渡すことで、リクエストトラッキングの改善が図られています。これらの変更により、ユーザーはより効率的にツールを利用できるようになります。 • モデルにデフォルト温度設定を追加する機能 • タグベースのネイティブツール呼び出し検出の追加 • すべてのLiteLLMモデルに対するネイティブツールサポートのデフォルト有効化 • アプリバージョンをプロバイダーに渡すことでリクエストトラッキングを改善

RooCodeInc/Roo-Code
release tool
生成AI推進者が持つべき3つの心構え

生成AI推進者が持つべき3つの心構え

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。

AI-Shift Tech Blog
platform tool
No Image

Claude 4.5 Opus' Soul Document

Richard Weiss managed to get Claude 4.5 Opus to spit out this 14,000 token document which Claude called the "Soul overview". Richard says: While extracting Claude 4.5 Opus' system message …

Simon Willison's Blog
platform
Boost SGLang Inference: Native NVIDIA Model Optimizer Integration for Seamless Quantization and Deployment

Boost SGLang Inference: Native NVIDIA Model Optimizer Integration for Seamless Quantization and Deployment

<p>(Updated on Dec 2)</p> <p>We are thrilled to announce a major new feature in SGLang: native support for <a href="https://github.com/NVIDIA/TensorRT-Model-...

LMSYS Blog
library tool
DeepSeek-V3.2

DeepSeek-V3.2

Two new open weight (MIT licensed) models from DeepSeek today: DeepSeek-V3.2 and DeepSeek-V3.2-Speciale, both 690GB, 685B parameters. Here's the PDF tech report. DeepSeek-V3.2 is DeepSeek's new flagship model, now running …

Simon Willison's Blog
platform
Release v3.35.1

Release v3.35.1

RooCodeIncのRoo-Codeリポジトリでのリリースv3.35.1は、2025年12月1日に公開されました。このリリースでは、タスクの委任前に保留中のツール結果をフラッシュする修正が行われ、さらにデバッグを容易にするためのIPCエラーロギングの改善が含まれています。これらの変更は、開発者がツールの動作をより正確に把握できるようにすることを目的としています。 • タスクの委任前に保留中のツール結果をフラッシュする修正 • IPCエラーロギングの改善によりデバッグが容易に • 開発者向けの機能改善が含まれている

RooCodeInc/Roo-Code
release tool
No Image

Inside Mirakl’s Agent Commerce Vision

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • 使用するほどに精度が向上するAIの学習能力

OpenAI Blog
tool
Release v3.35.0

Release v3.35.0

RooCodeIncのRoo-Codeのリリースv3.35.0では、メタデータ駆動のサブタスク機能が追加され、タスクのオーケストレーションが改善されました。新たに多くのプロバイダーに対するネイティブツール呼び出しのサポートが拡張され、特にOpenAI互換プロバイダーやVercel AI Gatewayなどが含まれています。また、UXの改善として、クラウドプロバイダー中心のオンボーディングフローが更新され、インターフェースがクリーンに整理されました。新しいツールとして、ファイル編集操作を効率化するapply_patchや、バッチテキスト置換を行うsearch_and_replaceが追加されました。デバッグ機能も強化され、APIとUIの履歴を表示するボタンが追加されました。 • メタデータ駆動のサブタスク機能が追加され、タスクのオーケストレーションが改善された。 • 多くのプロバイダーに対するネイティブツール呼び出しのサポートが拡張された。 • 新しいapply_patchツールが追加され、ファイル編集操作が効率化された。 • search_and_replaceツールにより、ファイル間でのバッチテキスト置換が可能になった。 • UXの改善により、クラウドプロバイダー中心のオンボーディングフローが更新された。

RooCodeInc/Roo-Code
release tool
No Image

I sent out my November sponsor newsletter

I just send out the November edition of my sponsors-only monthly newsletter. If you are a sponsor (or if you start a sponsorship now) you can access a copy here. …

Simon Willison's Blog
podcast tool youtube
No Image

Efficient MoE Pre-training at Scale on 1K AMD GPUs with TorchTitan

この記事では、AMDとMetaのPyTorchチームが協力して、1,024のAMD MI325X GPUを使用した大規模なMixture-of-Experts(MoE)モデルの効率的な事前トレーニングを実現した方法について説明しています。TorchTitanとPrimus-Turboというオープンソースのカーネルライブラリを調整することで、DeepSeek-V3とLlama 4-Scoutのトレーニングにおいて、2.77倍のスピードアップと96%のスケーリング効率を達成しました。TorchTitanは、複数のGPUおよびノードクラスターでの大規模トレーニングのためのMetaのPyTorchネイティブの設計図であり、設定ファイルを通じてパラレル処理の度合いを簡単に調整できます。MoEモデルは、専門家のプールを使用して計算を効率化し、数百億パラメータのモデルを密なモデルの速度でトレーニングすることを可能にします。 • AMDとMetaが協力してMoEモデルの効率的なトレーニングを実現 • TorchTitanとPrimus-Turboを使用して1,024のGPUでのスケーリングを最適化 • DeepSeek-V3で2.77倍のスピードアップを達成 • 96%のスケーリング効率を実現 • TorchTitanは大規模トレーニングのための設定ファイルを使用して簡単に調整可能 • MoEモデルは専門家のプールを使用して計算を効率化 • 数百億パラメータのモデルを密なモデルの速度でトレーニング可能

PyTorch Blog
library tool
Gemini 3 and Nano Banana Pro in Search are coming to more countries around the world.

Gemini 3 and Nano Banana Pro in Search are coming to more countries around the world.

We're bringing our most intelligent model yet, Gemini 3 Pro, to Google Search in more countries around the world.

Google AI Blog
platform
DeepSeek V3.2 models now available in Vercel AI Gateway

DeepSeek V3.2 models now available in Vercel AI Gateway

You can now access the newest DeepSeek V3.2 models, V3.2 and V3.2 Speciale in Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api cloud tool
Trinity Mini model now available in Vercel AI Gateway

Trinity Mini model now available in Vercel AI Gateway

You can now access the newest Arcee AI model Trinity Mini in Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api tool
No Image

Funding grants for new research into AI and mental health

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特にエラーの検出やコードの最適化に役立ちます。具体的には、AIがリアルタイムでコードを分析し、改善点を提案する機能が搭載されています。また、ユーザーインターフェースは直感的で使いやすく、導入も簡単です。さらに、他の開発環境との互換性も考慮されており、幅広いプラットフォームで利用可能です。これにより、開発者は生産性を向上させることが期待されます。 • AI技術を活用した新しい開発ツールの紹介 • リアルタイムでコードを分析し、改善点を提案する機能 • 直感的で使いやすいユーザーインターフェース • 簡単な導入プロセス • 幅広いプラットフォームとの互換性 • 生産性向上が期待される

OpenAI Blog
tool
959: TypeScript on the GPU with TypeGPU creator Iwo Plaza

959: TypeScript on the GPU with TypeGPU creator Iwo Plaza

この記事では、TypeGPUの創設者Iwo Plazaが、WebGPUがウェブ上でのグラフィックスと計算能力の新たな波をどのように解き放っているかについて語っています。TypeGPUは、TypeScriptでシェーダーを作成するためのライブラリであり、WebGPUとWebGLの違いや、シェーダー言語の難しさを克服する方法についても触れています。また、TypeGPUがどのようにしてGPUとCPU間のデータ交換を容易にし、TypeScriptをシェーダーコードに変換するコンパイラを構築しているのかについても詳しく説明されています。さらに、AIのブラウザ内推論や、TypeGPUのドキュメント作成の哲学、API設計におけるドキュメントの役割についても言及されています。 • TypeGPUはTypeScriptでシェーダーを作成するためのライブラリである。 • WebGPUはウェブ上での新しいGPUアクセスの時代を切り開いている。 • シェーダー言語の難しさを克服するためのアプローチが提案されている。 • GPUとCPU間のデータ交換を容易にするためにZodのようなスキーマを使用している。 • TypeScriptをシェーダーコードに変換するコンパイラを構築している。 • AIのブラウザ内推論に関する未来の抽象化についても言及されている。

syntax-fm
api library tool
SARLO-80: Worldwide Slant SAR Language Optic Dataset at 80 cm Resolution

SARLO-80: Worldwide Slant SAR Language Optic Dataset at 80 cm Resolution

A Blog post by Hugging Science on Hugging Face

Hugging Face Blog
api tool
No Image

OpenAI and NORAD team up to bring new magic to “NORAD Tracks Santa”

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に統合できるため、導入が容易である点も強調されています。さらに、AIによるコード生成は、開発の効率を大幅に向上させることが期待されています。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への統合が容易 • 開発効率の向上が期待される

OpenAI Blog
tool
No Image

Accenture and OpenAI accelerate enterprise AI success

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
No Image

OpenAI takes an ownership stake in Thrive Holdings to accelerate enterprise AI adoption

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
From research to production: Accelerate OSS LLM with EAGLE-3 on Vertex

From research to production: Accelerate OSS LLM with EAGLE-3 on Vertex

<p><strong>TL;DR:</strong> Speculative decoding boosts LLM inference, but traditional methods require a separate, inefficient draft model. Vertex AI utilizes...

LMSYS Blog
api tool
Transformers v5: Simple model definitions powering the AI ecosystem

Transformers v5: Simple model definitions powering the AI ecosystem

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api library tool
No Image

Quoting Felix Nolan

I am increasingly worried about AI in the video game space in general. [...] I'm not sure that the CEOs and the people making the decisions at these sorts of …

Simon Willison's Blog
platform
No Image

ChatGPT is three years old today

It's ChatGPT's third birthday today. It's fun looking back at Sam Altman's low key announcement thread from November 30th 2022: today we launched ChatGPT. try talking with it here: chat.openai.com …

Simon Willison's Blog
platform
🥇Top AI Papers of the Week

🥇Top AI Papers of the Week

The Top AI Papers of the Week (November 24 - 30)

Elvis Saravia's NLP Blog
framework tool
Claude のツール検索ツールを試してみた

Claude のツール検索ツールを試してみた

MCP では多くのツール定義が LLM のコンテキストを圧迫する問題があります。Claude のツール検索ツールを使用すると、必要に応じて関連するツールのみを LLM に提供でき、コンテキスト圧迫を軽減できます。この記事では Claude の TypeScript クライアントを使用して、ツール検索ツールを実際に使用した例を紹介します。

azukiazusa のテックブログ2
api tool
The space of minds

The space of minds

On the space of minds and the optimizations that give rise to them.

Andrej Karpathy's Blog
platform
🤖AI Agents Weekly: Claude Opus 4.5, OmniScientist, FLUX.2, General Agentic Memory

🤖AI Agents Weekly: Claude Opus 4.5, OmniScientist, FLUX.2, General Agentic Memory

Claude Opus 4.5, OmniScientist, FLUX.2, General Agentic Memory

Elvis Saravia's NLP Blog
platform
No Image

Context plumbing

Matt Webb coins the term context plumbing to describe the kind of engineering needed to feed agents the right context at the right time: Context appears at disparate sources, by …

Simon Willison's Blog
platform
No Image

Quoting Wikipedia content guideline

Large language models (LLMs) can be useful tools, but they are not good at creating entirely new Wikipedia articles. Large language models should not be used to generate new Wikipedia …

Simon Willison's Blog
api tool
No Image

A ChatGPT prompt equals about 5.1 seconds of Netflix

In June 2025 Sam Altman claimed about ChatGPT that "the average query uses about 0.34 watt-hours". In March 2020 George Kamiya of the International Energy Agency estimated that "streaming a …

Simon Willison's Blog
api cloud tool
Bluesky Thread Viewer thread by @simonwillison.net

Bluesky Thread Viewer thread by @simonwillison.net

I've been having a lot of fun hacking on my Bluesky Thread Viewer JavaScript tool with Claude Code recently. Here it renders a thread (complete with demo video) talking about …

Simon Willison's Blog
api tool
Release v3.34.8

Release v3.34.8

RooCodeIncのRoo-Codeリポジトリで、バージョン3.34.8がリリースされました。このリリースでは、ネイティブプロトコル用のnew_taskツールにおけるレースコンディションの修正が行われました。修正はプルリクエスト#9655によって提案され、寄稿者はdaniel-lxsです。リリース日は2025年11月27日で、GitHubの検証済み署名が付与されています。 • バージョン3.34.8がリリースされた • ネイティブプロトコル用のnew_taskツールにおけるレースコンディションが修正された • 修正はプルリクエスト#9655によって提案された • 寄稿者はdaniel-lxsである • リリース日は2025年11月27日である

RooCodeInc/Roo-Code
release tool
No Image

Quoting Qwen3-VL Technical Report

To evaluate the model’s capability in processing long-context inputs, we construct a video “Needle-in- a-Haystack” evaluation on Qwen3-VL-235B-A22B-Instruct. In this task, a semantically salient “needle” frame—containing critical visual evidence—is inserted …

Simon Willison's Blog
platform
Release v3.34.7

Release v3.34.7

この記事は、RooCodeIncのRoo-Codeリポジトリのバージョン3.34.7のリリースノートを提供しています。このリリースでは、Anthropicプロバイダーにおけるネイティブツールのサポートが追加され、z.aiモデルおよびMoonshotモデルに対するネイティブツール呼び出しが有効化されました。また、OpenRouterツール呼び出しの処理改善や、read_fileツールに対する厳格なスキーマ検証の修正、write_to_fileにおけるENOENTエラーを防ぐための親ディレクトリの早期作成が行われました。さらに、claude-codeプロバイダーに対するネイティブツールと温度サポートの無効化が行われ、プロバイダーのウェルカム後に「クラウドに移動中」画面が追加され、オンボーディングが改善されました。 • Anthropicプロバイダーでのネイティブツールサポートの追加 • z.aiモデルおよびMoonshotモデルに対するネイティブツール呼び出しの有効化 • OpenRouterツール呼び出しの処理改善 • read_fileツールに対する厳格なスキーマ検証の修正 • write_to_fileでのENOENTエラー防止のための親ディレクトリの早期作成 • claude-codeプロバイダーに対するネイティブツールと温度サポートの無効化 • オンボーディング改善のための新しい画面追加

RooCodeInc/Roo-Code
release tool
No Image

deepseek-ai/DeepSeek-Math-V2

New on Hugging Face, a specialist mathematical reasoning LLM from DeepSeek. This is their entry in the space previously dominated by proprietary models from OpenAI and Google DeepMind, both of …

Simon Willison's Blog
platform
2025-11-27

2025-11-27

この記事では、mastraの最新リリース(2025年11月27日)における新機能と改善点について説明しています。主なハイライトとして、ワークフローとネットワークからのエージェント応答のストリーミングが可能になり、実行メタデータがUIに流れるようになりました。これにより、ユーザーはリアルタイムで進行状況を確認できるようになり、重複したステップやメタデータの欠落が解消されました。また、AI-SDKの音声モデルがサポートされ、OpenAIやElevenLabsなどの音声モデルを直接使用できるようになりました。さらに、ワークフロー内でエージェントのストリーミングテキストチャンクをサポートし、UIメッセージとして自動的に変換される機能が追加されました。 • エージェント応答のストリーミングが可能になり、リアルタイムで進行状況を確認できるようになった。 • ワークフロー内でのエージェントのストリーミングテキストチャンクのサポートが追加された。 • AI-SDKの音声モデルがサポートされ、OpenAIやElevenLabsの音声モデルを直接使用できる。 • 重複したステップやメタデータの欠落が解消された。 • UIメッセージとして自動的に変換される機能が追加された。

mastra-ai/mastra
api release tool
Top 5 AI code review tools in 2025

Top 5 AI code review tools in 2025

A hands-on comparison of five AI code review tools – Qodo, Traycer, CodeRabbit, Sourcery, and CodeAnt AI, tested on the same codebase to see which one actually delivers.

logrocket-dev
tool
How Myriad Genetics achieved fast, accurate, and cost-efficient document processing using the AWS open-source Generative AI Intelligent Document Processing Accelerator

How Myriad Genetics achieved fast, accurate, and cost-efficient document processing using the AWS open-source Generative AI Intelligent Document Processing Accelerator

In this post, we explore how Myriad Genetics partnered with the AWS Generative AI Innovation Center to transform their healthcare document processing pipeline using Amazon Bedrock and Amazon Nova foundation models, achieving 98% classification accuracy while reducing costs by 77% and processing time by 80%. We detail the technical implementation using AWS's open-source GenAI Intelligent Document Processing Accelerator, the optimization strategies for document classification and key information extraction, and the measurable business impact on Myriad's prior authorization workflows.

AWS Machine Learning Blog
tool
How CBRE powers unified property management search and digital assistant using Amazon Bedrock

How CBRE powers unified property management search and digital assistant using Amazon Bedrock

In this post, CBRE and AWS demonstrate how they transformed property management by building a unified search and digital assistant using Amazon Bedrock, enabling professionals to access millions of documents and multiple databases through natural language queries. The solution combines Amazon Nova Pro for SQL generation and Claude Haiku for document interactions, achieving a 67% reduction in processing time while maintaining enterprise-grade security across more than eight million documents.

AWS Machine Learning Blog
api cloud tool
Managed Tiered KV Cache and Intelligent Routing for Amazon SageMaker HyperPod

Managed Tiered KV Cache and Intelligent Routing for Amazon SageMaker HyperPod

In this post, we introduce Managed Tiered KV Cache and Intelligent Routing for Amazon SageMaker HyperPod, new capabilities that can reduce time to first token by up to 40% and lower compute costs by up to 25% for long context prompts and multi-turn conversations. These features automatically manage distributed KV caching infrastructure and intelligent request routing, making it easier to deploy production-scale LLM inference workloads with enterprise-grade performance while significantly reducing operational overhead.

AWS Machine Learning Blog
api tool
Release v3.34.6

Release v3.34.6

この記事は、RooCodeのリリースv3.34.6に関するもので、2025年11月26日に公開されました。このリリースでは、AWS Bedrockの埋め込みサポートがコードインデックスに追加され、Mistralプロバイダーのためのネイティブツール呼び出しサポートが導入されました。また、OpenAIの並列ツール呼び出しのためにMULTIPLE_NATIVE_TOOL_CALLS実験がワイヤリングされ、OpenRouter Anthropicのための詳細なツールストリーミングが追加されました。さらに、クロスリージョンが有効な場合のBedrockのグローバル推論選択が許可され、Vertex APIに送信する前に非Anthropicコンテンツブロックをフィルタリングする修正が行われました。その他にも、APIレスポンスの空のキャッシュを防ぐ修正や、ネイティブツール呼び出しにおける行範囲の文字列を行範囲オブジェクトに変換する修正が含まれています。 • AWS Bedrockの埋め込みサポートが追加された • Mistralプロバイダーのネイティブツール呼び出しサポートが導入された • OpenAIの並列ツール呼び出しのための実験がワイヤリングされた • OpenRouter Anthropicのための詳細なツールストリーミングが追加された • クロスリージョンが有効な場合のBedrockのグローバル推論選択が許可された • 非Anthropicコンテンツブロックをフィルタリングする修正が行われた • APIレスポンスの空のキャッシュを防ぐ修正が行われた • 行範囲の文字列を行範囲オブジェクトに変換する修正が行われた

RooCodeInc/Roo-Code
api release tool
Here’s how researchers in Asia-Pacific are using AlphaFold

Here’s how researchers in Asia-Pacific are using AlphaFold

Learn more about AlphaFold, Google’s AI system that accurately predicts protein structures.

Google AI Blog
platform
Apply fine-grained access control with Bedrock AgentCore Gateway interceptors

Apply fine-grained access control with Bedrock AgentCore Gateway interceptors

We are launching a new feature: gateway interceptors for Amazon Bedrock AgentCore Gateway. This powerful new capability provides fine-grained security, dynamic access control, and flexible schema management.

AWS Machine Learning Blog
api cloud security
Claude Agent Skills Explained

Claude Agent Skills Explained

Agent Skills are organized folders that package expertise that Claude can automatically invoke when relevant to the task at hand. Join the Claude Developer Discord - https://anthropic.com/discord Learn more about Agent Skills - https://www.claude.com/blog/skills 00:06 Introducing Agent Skills 00:30 How Agent Skills work 01:08 Agent Skills vs Claude.md 01:42 Agent Skills vs MCP Servers 02:05 Agent Skills vs Subagents 02:33 Putting it all together 02:48 Summary

YouTube Anthropic
How Condé Nast accelerated contract processing and rights analysis with Amazon Bedrock

How Condé Nast accelerated contract processing and rights analysis with Amazon Bedrock

In this post, we explore how Condé Nast used Amazon Bedrock and Anthropic’s Claude to accelerate their contract processing and rights analysis workstreams. The company’s extensive portfolio, spanning multiple brands and geographies, required managing an increasingly complex web of contracts, rights, and licensing agreements.

AWS Machine Learning Blog
api tool
Building AI-Powered Voice Applications: Amazon Nova Sonic Telephony Integration Guide

Building AI-Powered Voice Applications: Amazon Nova Sonic Telephony Integration Guide

Available through the Amazon Bedrock bidirectional streaming API, Amazon Nova Sonic can connect to your business data and external tools and can be integrated directly with telephony systems. This post will introduce sample implementations for the most common telephony scenarios.

AWS Machine Learning Blog
api cloud tool
University of California Los Angeles delivers an immersive theater experience with AWS generative AI services

University of California Los Angeles delivers an immersive theater experience with AWS generative AI services

In this post, we will walk through the performance constraints and design choices by OARC and REMAP teams at UCLA, including how AWS serverless infrastructure, AWS Managed Services, and generative AI services supported the rapid design and deployment of our solution. We will also describe our use of Amazon SageMaker AI and how it can be used reliably in immersive live experiences.

AWS Machine Learning Blog
framework tool
Optimizing Mobileye’s REM™ with AWS Graviton: A focus on ML inference and Triton integration

Optimizing Mobileye’s REM™ with AWS Graviton: A focus on ML inference and Triton integration

This post is written by Chaim Rand, Principal Engineer, Pini Reisman, Software Senior Principal Engineer, and Eliyah Weinberg, Performance and Technology Innovation Engineer, at Mobileye. The Mobileye team would like to thank Sunita Nadampalli and Guy Almog from AWS for their contributions to this solution and this post. Mobileye is driving the global evolution toward […]

AWS Machine Learning Blog
tool
Evaluate models with the Amazon Nova evaluation container using Amazon SageMaker AI

Evaluate models with the Amazon Nova evaluation container using Amazon SageMaker AI

This blog post introduces the new Amazon Nova model evaluation features in Amazon SageMaker AI. This release adds custom metrics support, LLM-based preference testing, log probability capture, metadata analysis, and multi-node scaling for large evaluations.

AWS Machine Learning Blog
api cloud tool
No Image

Mixpanel security incident: what OpenAI users need to know

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、ツールがそれに基づいてコードを生成することが可能です。また、既存のコードの改善提案やバグの修正も行えるため、開発効率が大幅に向上します。さらに、ユーザーインターフェースも直感的で使いやすく設計されており、導入のハードルが低くなっています。これにより、幅広い開発者がこのツールを活用できるようになります。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づくコード生成機能 • 既存コードの改善提案やバグ修正機能 • 開発効率の向上 • 直感的で使いやすいユーザーインターフェース

OpenAI Blog
tool
Enhanced performance for Amazon Bedrock Custom Model Import

Enhanced performance for Amazon Bedrock Custom Model Import

You can now achieve significant performance improvements when using Amazon Bedrock Custom Model Import, with reduced end-to-end latency, faster time-to-first-token, and improved throughput through advanced PyTorch compilation and CUDA graph optimizations. With Amazon Bedrock Custom Model Import you can to bring your own foundation models to Amazon Bedrock for deployment and inference at scale. In this post, we introduce how to use the improvements in Amazon Bedrock Custom Model Import.

AWS Machine Learning Blog
api tool
No Image

The Future of Inference: PyTorch ATX Event

2025年9月17日、PyTorch ATXはvLLMコミュニティとRed Hatと共に「The Future of Inferencing」イベントをオースティンで開催しました。このイベントには、vLLMに関わる専門家が集まり、最新のLLM推論技術について議論しました。90人以上の参加者が集まり、INT4/INT8量子化、プルーニング戦略、PagedAttentionメモリ管理、連続バッチ処理、推測デコーディング、マルチノードデプロイメントアーキテクチャなどの技術的な深掘りが行われました。Jason MeauxはPyTorch ATXメンバーのプロジェクトについての最新情報を共有し、Steve WattはvLLMの紹介とAWSでのデプロイデモを行いました。Luka GovedičはPagedAttentionや量子化アプローチについての中級セッションを提供し、Huamin Chenは意図を考慮した「mixture-of-models」ルーターを説明しました。Greg Pereiraは分散推論の課題を探求し、KVキャッシュ管理のデモを行いました。参加者は生産準備が整った推論システムを構築するための概念的枠組みと実行可能な戦略を持ち帰りました。次回のイベントは2026年2月に予定されています。 • PyTorch ATXがvLLMコミュニティとRed Hatと共に推論技術に関するイベントを開催した。 • 90人以上の専門家が集まり、最新のLLM推論技術について議論した。 • INT4/INT8量子化、プルーニング戦略、PagedAttentionメモリ管理などのトピックが扱われた。 • vLLMのデプロイ方法についてのデモが行われ、AWSやAMDクラウドでの実装が紹介された。 • 意図を考慮した「mixture-of-models」ルーターが説明され、よりコスト効率的で正確な推論サービスが提案された。 • 分散推論の課題についてのセッションがあり、KVキャッシュ管理のデモが行われた。

PyTorch Blog
framework tool
You don’t need AI for everything: A reality check for developers

You don’t need AI for everything: A reality check for developers

Alexandra Spalato, fractional AI officer, shares a practical framework to help devs decide when and how to use AI and agents.

logrocket-dev
tool
Intellect-3 model from Prime Intellect AI available on the Vercel AI Gateway

Intellect-3 model from Prime Intellect AI available on the Vercel AI Gateway

You can now access Prime Intellect AI's Intellect-3 model in Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api cloud tool
Programmatic Tool Calling(PTC)の何が新しいのか?

Programmatic Tool Calling(PTC)の何が新しいのか?

AnthropicがClaude(モデル) APIの新機能として「Programmatic Tool Calling」(以下PTC)を パブリックベータとして公開しました。 Introducing advanced tool use on the Claude Developer PlatformClaude can now discover, learn, and execute tools dynamically to enable agents that take action in the real world. Here’s how. 一言で言うと、これは「ClaudeがToolを呼び出す処理をPythonコードとして生成し、 Anthropicが提供するサンドボックス内で実行する」機能です。 従来のTool Useでは、Toolを1つ呼ぶたびにClaudeが次のアクションを判断し、 その結果をすべてコンテキストウィンドウに追加していました。 10個のToolを連鎖して呼び出すと、10回分の推論と、

Lai.so Blog
api tool
Release v3.34.5

Release v3.34.5

RooCodeIncのGitHubリポジトリで公開されたリリースv3.34.5では、いくつかの新機能と修正が含まれています。主な変更点として、複数のネイティブツール呼び出しを可能にする実験的機能が追加され、Bedrock Opus 4.5がグローバル推論モデルリストに追加されました。また、ツールプロトコルが変更された際にAPIハンドラを更新する修正や、minimax-m2およびclaude-haiku-4.5のデフォルトとしてネイティブツールを設定する変更が行われました。さらに、XMLツールに対して単一ファイルの読み取り専用設定が適用され、web-evalsダッシュボードが動的ツール列とUX改善で強化されました。最後に、Roo Code Cloudを埋め込みプロバイダーとしてサポートする変更は、いくつかの問題を修正するために元に戻されました。 • 複数のネイティブツール呼び出しを可能にする実験的機能の追加 • Bedrock Opus 4.5をグローバル推論モデルリストに追加 • ツールプロトコル変更時のAPIハンドラ更新の修正 • minimax-m2およびclaude-haiku-4.5のデフォルトとしてネイティブツールを設定 • XMLツールに対する単一ファイルの読み取り専用設定の適用 • web-evalsダッシュボードの動的ツール列とUX改善の強化 • Roo Code Cloudの埋め込みプロバイダーサポートの変更を元に戻す

RooCodeInc/Roo-Code
release tool
Amazon SageMaker AI introduces EAGLE based adaptive speculative decoding to accelerate generative AI inference

Amazon SageMaker AI introduces EAGLE based adaptive speculative decoding to accelerate generative AI inference

Amazon SageMaker AI now supports EAGLE-based adaptive speculative decoding, a technique that accelerates large language model inference by up to 2.5x while maintaining output quality. In this post, we explain how to use EAGLE 2 and EAGLE 3 speculative decoding in Amazon SageMaker AI, covering the solution architecture, optimization workflows using your own datasets or SageMaker's built-in data, and benchmark results demonstrating significant improvements in throughput and latency.

AWS Machine Learning Blog
api tool
Get an in-depth look at Gemini 3 with CEO Sundar Pichai.

Get an in-depth look at Gemini 3 with CEO Sundar Pichai.

Sundar Pichai sits down with Logan Kilpatrick to discuss Gemini 3 on the Google AI: Release Notes podcast.

Google AI Blog
podcast
Train custom computer vision defect detection model using Amazon SageMaker

Train custom computer vision defect detection model using Amazon SageMaker

In this post, we demonstrate how to migrate computer vision workloads from Amazon Lookout for Vision to Amazon SageMaker AI by training custom defect detection models using pre-trained models available on AWS Marketplace. We provide step-by-step guidance on labeling datasets with SageMaker Ground Truth, training models with flexible hyperparameter configurations, and deploying them for real-time or batch inference—giving you greater control and flexibility for automated quality inspection use cases.

AWS Machine Learning Blog
tool
No Image

Expanding data residency access to business customers worldwide

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
No Image

Google Antigravity Exfiltrates Data

PromptArmor demonstrate a concerning prompt injection chain in Google's new Antigravity IDE: In this attack chain, we illustrate that a poisoned web source (an integration guide) can manipulate Gemini into …

Simon Willison's Blog
api security tool
1.0.4

1.0.4

この記事は、GitHub上のlangchain-ai/langgraphリポジトリのバージョン1.0.4のリリースに関する情報を提供しています。このリリースでは、リモートグラフの設定可能なフィールドからスレッドIDを削除する変更や、いくつかの参照のクリーンアップが行われました。また、Python SDKにおいてより多くの型チェックが追加され、ストリームモードの値に関する修正も含まれています。さらに、prebuiltバージョン1.0.3のリリースや、prepare_push_*関数の分離も行われています。これらの変更は、全体的なパフォーマンスや安定性の向上を目指しています。 • リモートグラフの設定可能なフィールドからスレッドIDを削除 • いくつかの参照をクリーンアップ • Python SDKにおいて型チェックを追加 • ストリームモードの値に関する修正 • prebuiltバージョン1.0.3のリリース • prepare_push_*関数を分離

langchain-ai/langgraph
release tool
Release v3.34.4

Release v3.34.4

RooCodeIncのGitHubリポジトリで公開されたリリースv3.34.4では、新しいBlack Forest Labsの画像生成モデルが追加され、Roo Code Cloudで無料で利用可能であることが発表されました。また、OpenRouterでも利用可能です。このリリースには、ネイティブモードAPIの履歴において動的MCPツール名を保持する修正や、ネイティブツールを使用した際の要約メッセージ内でのtool_useブロックを保持する修正も含まれています。これにより、会話のコンテキストが維持されることが期待されます。 • 新しいBlack Forest Labsの画像生成モデルが追加された • Roo Code Cloudで無料で利用可能 • OpenRouterでも利用可能 • 動的MCPツール名を保持する修正が行われた • ネイティブツール使用時の要約メッセージ内でのtool_useブロックを保持する修正が行われた

RooCodeInc/Roo-Code
release tool
Practical implementation considerations to close the AI value gap

Practical implementation considerations to close the AI value gap

The AWS Customer Success Center of Excellence (CS COE) helps customers get tangible value from their AWS investments. We've seen a pattern: customers who build AI strategies that address people, process, and technology together succeed more often. In this post, we share practical considerations that can help close the AI value gap.

AWS Machine Learning Blog
platform tool
Introducing bidirectional streaming for real-time inference on Amazon SageMaker AI

Introducing bidirectional streaming for real-time inference on Amazon SageMaker AI

We're introducing bidirectional streaming for Amazon SageMaker AI Inference, which transforms inference from a transactional exchange into a continuous conversation. This post shows you how to build and deploy a container with bidirectional streaming capability to a SageMaker AI endpoint. We also demonstrate how you can bring your own container or use our partner Deepgram's pre-built models and containers on SageMaker AI to enable bi-directional streaming feature for real-time inference.

AWS Machine Learning Blog
api tool
No Image

Constant-time support lands in LLVM: Protecting cryptographic code at the compiler level

Substantial LLVM contribution from Trail of Bits. Timing attacks against cryptography algorithms are a gnarly problem: if an attacker can precisely time a cryptographic algorithm they can often derive details …

Simon Willison's Blog
compiler tool
The Google guide for holiday help

The Google guide for holiday help

Learn more about using Google products like Gemini, Search, Shopping, Pixel and more over the holidays.

Google AI Blog
api cloud tool
4 ways to refine your content in Flow

4 ways to refine your content in Flow

You’ll now get more creative control in Flow with new refinement and editing capabilities.

Google AI Blog
tool
Warner Bros. Discovery achieves 60% cost savings and faster ML inference with AWS Graviton

Warner Bros. Discovery achieves 60% cost savings and faster ML inference with AWS Graviton

Warner Bros. Discovery (WBD) is a leading global media and entertainment company that creates and distributes the world’s most differentiated and complete portfolio of content and brands across television, film and streaming. In this post, we describe the scale of our offerings, artificial intelligence (AI)/machine learning (ML) inference infrastructure requirements for our real time recommender systems, and how we used AWS Graviton-based Amazon SageMaker AI instances for our ML inference workloads and achieved 60% cost savings and 7% to 60% latency improvements across different models.

AWS Machine Learning Blog
cloud tool
Physical AI in practice: Technical foundations that fuel human-machine interactions

Physical AI in practice: Technical foundations that fuel human-machine interactions

In this post, we explore the complete development lifecycle of physical AI—from data collection and model training to edge deployment—and examine how these intelligent systems learn to understand, reason, and interact with the physical world through continuous feedback loops. We illustrate this workflow through Diligent Robotics' Moxi, a mobile manipulation robot that has completed over 1.2 million deliveries in hospitals, saving nearly 600,000 hours for clinical staff while transforming healthcare logistics and returning valuable time to patient care.

AWS Machine Learning Blog
tool
Using skills with Deep Agents

Using skills with Deep Agents

tl;dr: Anthropic recently introduced the idea of agent skills. Skills are simply folders containing a SKILL.md file along with any associated files (e.g., documents or scripts) that an agent can discover and load dynamically to perform better at specific tasks. We've added skills support to deepagents-CLI. The

LangChain Blog
library tool
HyperPod now supports Multi-Instance GPU to maximize GPU utilization for generative AI tasks

HyperPod now supports Multi-Instance GPU to maximize GPU utilization for generative AI tasks

In this post, we explore how Amazon SageMaker HyperPod now supports NVIDIA Multi-Instance GPU (MIG) technology, enabling you to partition powerful GPUs into multiple isolated instances for running concurrent workloads like inference, research, and interactive development. By maximizing GPU utilization and reducing wasted resources, MIG helps organizations optimize costs while maintaining performance isolation and predictable quality of service across diverse machine learning tasks.

AWS Machine Learning Blog
cloud tool
AlphaFold: Five years of impact

AlphaFold: Five years of impact

Explore five years of AlphaFold’s impact on biology. Learn how this Nobel Prize-winning AI is accelerating scientific discovery globally

DeepMind Blog
api tool
Revealing a key protein behind heart disease

Revealing a key protein behind heart disease

Discover how scientists used AlphaFold to map the protein behind heart disease and how this breakthrough could transform treatment.

DeepMind Blog
api library tool
Patch release v4.57.3

Patch release v4.57.3

この記事は、Hugging FaceのTransformersライブラリのバージョン4.57.3のパッチリリースについて説明しています。このリリースでは、local_files_only=Trueでモデルを読み込む際に発生する隠れたバグと、最近のパッチに関連するタイプミスが修正されました。主な修正内容はコミットb605555に記載されています。この問題は多くのユーザーに影響を与えるため、前のリリースは取り消される予定です。 • local_files_only=Trueでモデルを読み込む際の隠れたバグが修正された • 最近のパッチに関連するタイプミスが修正された • 主な修正はコミットb605555に記載されている • 多くのユーザーに影響を与えるため、前のリリースは取り消される予定

huggingface/transformers
release tool
Release v3.34.3

Release v3.34.3

RooCodeIncのRoo-Codeのリリースv3.34.3では、ネイティブツール呼び出しのストリーミング機能が実装され、ツール実行中にリアルタイムフィードバックが提供されるようになった。また、Claude Opus 4.5モデルがClaude CodeプロバイダーおよびBedrockプロバイダーに追加され、Opus 4.5モデルのパフォーマンス向上のためにキャッシングが有効化された。さらに、Roo Code Cloudが埋め込みプロバイダーとしてサポートされ、いくつかのバグ修正や設定ページへの連絡先リンクの追加も行われた。これにより、ユーザーはより効率的にツールを利用できるようになる。 • ネイティブツール呼び出しのストリーミング機能を実装し、リアルタイムフィードバックを提供 • Claude Opus 4.5モデルをClaude CodeプロバイダーおよびBedrockプロバイダーに追加 • Opus 4.5モデルのパフォーマンス向上のためにキャッシングを有効化 • Roo Code Cloudを埋め込みプロバイダーとしてサポート • 設定ページに連絡先リンクを追加し、ユーザーの利便性を向上

RooCodeInc/Roo-Code
api release tool
The 9 best AI workflow automation tools in 2026

The 9 best AI workflow automation tools in 2026

Looking for AI workflow automation tools? Compare n8n, Zapier, Make, and 6 other top platforms. Find the best fit for beginners, developers, and enterprise teams.

n8n Blog
api cloud tool
FLUX.2 Pro image model is now available on Vercel AI Gateway

FLUX.2 Pro image model is now available on Vercel AI Gateway

You can now access the newest image model FLUX.2 Pro from Black Forest Labs in Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api tool
Post-hoc Rationalization: LLMの推論は「言い訳」か?

Post-hoc Rationalization: LLMの推論は「言い訳」か?

AI ShiftのTECH BLOGです。AI技術の情報や活用方法などをご案内いたします。

AI-Shift Tech Blog
platform
No Image

llm-anthropic 0.23

New plugin release adding support for Claude Opus 4.5, including the new thinking_effort option: llm install -U llm-anthropic llm -m claude-opus-4.5 -o thinking_effort low 'muse on pelicans' This took longer …

Simon Willison's Blog
tool
LLM SVG Generation Benchmark

LLM SVG Generation Benchmark

Here's a delightful project by Tom Gally, inspired by my pelican SVG benchmark. He asked Claude to help create more prompts of the form Generate an SVG of [A] [doing] …

Simon Willison's Blog
platform
'Unified FP8: Moving Beyond Mixed Precision for Stable and Accelerated MoE RL'

'Unified FP8: Moving Beyond Mixed Precision for Stable and Accelerated MoE RL'

<blockquote> <p>TL;DR: We have implemented fully FP8-based sampling and training in RL. Experiments show that for MoE models, the larger the model, the more ...

LMSYS Blog
library tool
Continuous batching from first principles

Continuous batching from first principles

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api cloud tool
Diffusers welcomes FLUX-2

Diffusers welcomes FLUX-2

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
library tool
No Image

Inside JetBrains—the company reshaping how the world writes code

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
No Image

Quoting Claude Opus 4.5 system prompt

If the person is unnecessarily rude, mean, or insulting to Claude, Claude doesn't need to apologize and can insist on kindness and dignity from the person it’s talking with. Even …

Simon Willison's Blog
platform
Accelerate generative AI innovation in Canada with Amazon Bedrock cross-Region inference

Accelerate generative AI innovation in Canada with Amazon Bedrock cross-Region inference

We are excited to announce that customers in Canada can now access advanced foundation models including Anthropic's Claude Sonnet 4.5 and Claude Haiku 4.5 on Amazon Bedrock through cross-Region inference (CRIS). This post explores how Canadian organizations can use cross-Region inference profiles from the Canada (Central) Region to access the latest foundation models to accelerate AI initiatives. We will demonstrate how to get started with these new capabilities, provide guidance for migrating from older models, and share recommended practices for quota management.

AWS Machine Learning Blog
cloud tool
Release v3.34.2

Release v3.34.2

RooCodeIncのRoo-Codeリポジトリのリリースv3.34.2では、Claude Opus 4.5のサポートがAnthropicおよびVertexプロバイダーに追加され、OpenRouterではプロンプトキャッシングと推論予算が実装された。また、Roo Code Cloudが画像生成プロバイダーとして追加され、Geminiトランスフォーマーではサポートされていないコンテンツブロックを優雅にスキップする修正が行われた。LiteLLMキャッシュのフラッシュやXMLパーサーの状態をツールプロトコルに合わせるための修正も含まれている。さらに、Cerebrasモデルの更新やGemini 3モデルのreasoning_detailsフォーマットのサポートも追加された。 • Claude Opus 4.5のサポートがAnthropicおよびVertexプロバイダーに追加された。 • OpenRouterにプロンプトキャッシングと推論予算が実装された。 • Roo Code Cloudが画像生成プロバイダーとして追加された。 • Geminiトランスフォーマーでサポートされていないコンテンツブロックをスキップする修正が行われた。 • LiteLLMキャッシュのフラッシュやXMLパーサーの状態をツールプロトコルに合わせる修正が含まれている。 • Cerebrasモデルの更新が行われた。 • Gemini 3モデルのreasoning_detailsフォーマットのサポートが追加された。

RooCodeInc/Roo-Code
api release tool
sdk==0.2.10

sdk==0.2.10

この記事は、LangchainのSDKのバージョン0.2.10のリリースに関する情報を提供しています。このリリースでは、Assistants検索APIにnameパラメータが追加され、Python 3.14のサポートが追加されました。また、Python 3.9のサポートが削除され、いくつかのバグ修正や型チェックの改善が行われています。さらに、ドキュメントのスタイル修正や依存関係のアップグレードも含まれています。これにより、SDKの機能性と安定性が向上しています。 • Assistants検索APIにnameパラメータが追加された • Python 3.14のサポートが追加された • Python 3.9のサポートが削除された • 型チェックの改善が行われた • いくつかのバグ修正が含まれている • ドキュメントのスタイル修正が行われた • 依存関係のアップグレードが実施された

langchain-ai/langgraph
release tool
Power up your ML workflows with interactive IDEs on SageMaker HyperPod

Power up your ML workflows with interactive IDEs on SageMaker HyperPod

Amazon SageMaker HyperPod clusters with Amazon Elastic Kubernetes Service (EKS) orchestration now support creating and managing interactive development environments such as JupyterLab and open source Visual Studio Code, streamlining the ML development lifecycle by providing managed environments for familiar tools to data scientists. This post shows how HyperPod administrators can configure Spaces for their clusters, and how data scientists can create and connect to these Spaces.

AWS Machine Learning Blog
cloud tool
Claude Opus 4.5, and why evaluating new LLMs is increasingly difficult

Claude Opus 4.5, and why evaluating new LLMs is increasingly difficult

Anthropic released Claude Opus 4.5 this morning, which they call “best model in the world for coding, agents, and computer use”. This is their attempt to retake the crown for …

Simon Willison's Blog
api library tool
Claude Opus 4.5 now in Amazon Bedrock

Claude Opus 4.5 now in Amazon Bedrock

Anthropic's newest foundation model, Claude Opus 4.5, is now available in Amazon Bedrock, a fully managed service that offers a choice of high-performing foundation models from leading AI companies. In this post, I'll show you what makes this model different, walk through key business applications, and demonstrate how to use Opus 4.5's new tool use capabilities on Amazon Bedrock.

AWS Machine Learning Blog
api cloud tool
Claude Code on desktop

Claude Code on desktop

Today, we’re introducing Claude Code in our desktop apps in research preview. You can now run multiple local and remote Claude Code sessions in parallel: one agent fixing bugs, another researching GitHub, a third updating docs. It uses git worktrees for parallel repo work and offers a clean user interface with the option to open in VS Code or resume in CLI. Learn more: https://www.anthropic.com/news/claude-opus-4-5

YouTube Anthropic
Claude works with you on slides, spreadsheets, and contract redlines

Claude works with you on slides, spreadsheets, and contract redlines

See Claude Opus 4.5 tackle real work tasks—building board decks, transforming spreadsheet data, redlining contracts. Not generating drafts you'll throw away. Actual outputs you can download and use immediately. Try it: claude.ai

YouTube Anthropic
Introducing Claude Opus 4.5

Introducing Claude Opus 4.5

Claude Opus 4.5 sets a new standard for coding, agents, computer use, and enterprise workflows. It knows when to pause and think, which means fewer wasted steps and better results. When we gave it our two-hour engineering assignment, it scored higher than any human ever has. We’re excited to see what you build. Learn more: https://www.anthropic.com/news/claude-opus-4-5

YouTube Anthropic
Claude Opus 4.5 solves a puzzle game

Claude Opus 4.5 solves a puzzle game

Watch Claude complete a puzzle game using new capabilities that enable Claude to take action in the real world—the tool search tool and programmatic tool calling. Together, these updates enable Claude to navigate large tool libraries, chain operations efficiently, and accurately execute complex tasks. Learn more: https://www.anthropic.com/engineering/advanced-tool-use

YouTube Anthropic
Patch Release v4.57.2

Patch Release v4.57.2

この記事は、Hugging FaceのTransformersライブラリのバージョン4.57.2のパッチリリースについて説明しています。このリリースでは、特にMistralトークナイザーに関する問題が修正されました。具体的には、mistral3およびministralのためのAutoTokenizerマッピングの追加、tekken.jsonの自動変換、tekkenパターンマッチングの修正、モデル入力の隠れ状態のチェック、モジュールレベルのget_device_and_memory_breakdownからの無効な@staticmethodの削除が含まれています。 • Mistralトークナイザーに関する問題を修正 • mistral3およびministralのためのAutoTokenizerマッピングを追加 • tekken.jsonの自動変換を実施 • tekkenパターンマッチングの修正を行った • モデル入力の隠れ状態をチェックする機能を追加 • 無効な@staticmethodを削除

huggingface/transformers
library release
Deploy GPT-OSS models with Amazon Bedrock Custom Model Import

Deploy GPT-OSS models with Amazon Bedrock Custom Model Import

In this post, we show how to deploy the GPT-OSS-20B model on Amazon Bedrock using Custom Model Import while maintaining complete API compatibility with your current applications.

AWS Machine Learning Blog
api cloud tool
langchain==1.1.0

langchain==1.1.0

この記事は、Langchainのバージョン1.1.0のリリースに関する情報を提供しています。このリリースでは、SystemMessageのサポートや、HITLミドルウェアにおけるツール呼び出しの順序を変更しない修正が含まれています。また、モデルプロファイルのデータ分配や、ランタイム注入のためのテストの強化も行われています。さらに、非同期要約のサポートや、要約トリガー時のモデルコンテキストウィンドウの使用に関する機能も追加されています。これにより、Langchainの機能が向上し、より効率的な開発が可能になります。 • Langchainのバージョン1.1.0がリリースされた。 • SystemMessageのサポートが追加された。 • HITLミドルウェアでのツール呼び出しの順序を変更しない修正が行われた。 • モデルプロファイルのデータをパッケージ間で分配する機能が追加された。 • 非同期要約のサポートが追加された。 • 要約トリガー時にモデルコンテキストウィンドウを使用する機能が追加された。

langchain-ai/langchain
library release tool
langchain-xai==1.1.0

langchain-xai==1.1.0

この記事は、Langchainの新しいバージョンlangchain-xai==1.1.0のリリースに関する情報を提供しています。このリリースでは、いくつかの重要な変更が行われました。具体的には、データをパッケージ間で分配する機能が追加され、README.mdファイルの更新やスタイルのクリーンアップも行われました。これにより、ユーザーはより効率的にデータを管理できるようになります。リリース日は2023年11月24日で、GitHub上で公開されています。 • Langchainの新バージョンlangchain-xai==1.1.0がリリースされた。 • データをパッケージ間で分配する機能が追加された。 • README.mdファイルの更新が行われた。 • スタイルのクリーンアップが実施された。 • リリース日は2023年11月24日。

langchain-ai/langchain
release tool
langchain-perplexity==1.1.0

langchain-perplexity==1.1.0

この記事は、langchain-perplexityのバージョン1.1.0のリリースに関する情報を提供しています。このリリースでは、いくつかの新機能と改善が含まれています。具体的には、データをパッケージ間で分配する機能、推論モデル出力をサポートするための専用出力パーサーの作成、README.mdファイルの更新、使用メタデータのためのすべてのキーの追加などが行われました。また、コードのクリーンアップも実施されています。これにより、langchain-perplexityの機能が向上し、ユーザーにとっての利便性が増すことが期待されます。 • langchain-perplexityのバージョン1.1.0がリリースされた • データをパッケージ間で分配する機能が追加された • 推論モデル出力をサポートする専用出力パーサーが作成された • README.mdファイルが更新された • 使用メタデータのためのすべてのキーが追加された • コードのクリーンアップが行われた

langchain-ai/langchain
release tool
langchain-groq==1.1.0

langchain-groq==1.1.0

この記事は、langchain-groqのバージョン1.1.0のリリースに関する情報を提供しています。このリリースは2023年11月24日に行われ、主な変更点として、ドキュメント内のいくつかの参照の構文エラーの修正や、モデルプロファイルに関する機能が含まれています。また、データをパッケージ間で分配する機能も追加されています。これにより、ユーザーはより効率的にデータを管理できるようになります。 • langchain-groqのバージョン1.1.0が2023年11月24日にリリースされた • ドキュメント内の参照の構文エラーが修正された • モデルプロファイルに関する新機能が追加された • データをパッケージ間で分配する機能が実装された

langchain-ai/langchain
release tool
langchain-openai==1.1.0

langchain-openai==1.1.0

この記事は、langchain-openaiのバージョン1.1.0のリリースに関する情報を提供しています。このリリースでは、いくつかの重要な変更が行われました。具体的には、GPT-5の温度検証が大文字小文字を区別しないように修正され、いくつかの文書の参照構文エラーが修正されました。また、モデルプロファイルのデータがパッケージ間で分配される機能が追加され、Azureテキスト補完テストがスキップされるようになりました。これらの変更は、開発者がより効率的に作業できるようにすることを目的としています。 • GPT-5の温度検証が大文字小文字を区別しないように修正された。 • 文書の参照構文エラーがいくつか修正された。 • モデルプロファイルのデータがパッケージ間で分配される機能が追加された。 • Azureテキスト補完テストがスキップされるようになった。 • 開発者の作業効率を向上させることを目的としている。

langchain-ai/langchain
release tool
langchain-mistralai==1.1.0

langchain-mistralai==1.1.0

この記事は、langchain-mistralaiのバージョン1.1.0のリリースに関する情報を提供しています。このリリースでは、いくつかの変更が行われており、主な内容にはドキュメントの修正、モデルプロファイルのデータ分配、README.mdファイルの更新、スタイルのクリーンアップ、パッケージのバージョン変更の属性付け、リンクの修正などが含まれています。これにより、ユーザーは最新の機能や修正を利用できるようになります。 • langchain-mistralaiのバージョン1.1.0がリリースされた • ドキュメントのいくつかの参照の構文エラーが修正された • モデルプロファイルのデータがパッケージ間で分配されるようになった • README.mdファイルが更新された • スタイルのクリーンアップが行われた • パッケージの変更バージョンに属性が付けられた • リンクが修正された

langchain-ai/langchain
release tool
langchain-huggingface==1.1.0

langchain-huggingface==1.1.0

この記事は、langchain-huggingfaceのバージョン1.1.0のリリースに関する情報を提供しています。このリリースでは、いくつかの重要な変更が行われました。具体的には、モデルプロファイルの機能が追加され、データをパッケージ間で分配できるようになりました。また、README.mdファイルの更新や、ChatHuggingFaceに対してLLMパラメータを渡す修正が行われました。さらに、コードのスタイルに関するクリーンアップも実施されています。 • langchain-huggingfaceのバージョン1.1.0がリリースされた • モデルプロファイル機能が追加され、データをパッケージ間で分配可能に • README.mdファイルが更新された • ChatHuggingFaceにLLMパラメータを渡す修正が行われた • コードのスタイルが一部クリーンアップされた

langchain-ai/langchain
api library release
langchain-anthropic==1.2.0

langchain-anthropic==1.2.0

この記事は、langchain-anthropicのバージョン1.2.0のリリースに関する情報を提供しています。このリリースは2023年11月24日に行われ、主な変更点として、ドキュメントの参照構文エラーの修正、モデルプロファイルのデータをパッケージ間で分配する機能の追加、ModelCallRequestにおけるsetattrの非推奨化が含まれています。これにより、ユーザーはより効率的にデータを管理し、エラーを減少させることが期待されます。 • langchain-anthropicのバージョン1.2.0が2023年11月24日にリリースされた • ドキュメントの参照構文エラーが修正された • モデルプロファイルのデータをパッケージ間で分配する機能が追加された • ModelCallRequestにおけるsetattrが非推奨となった

langchain-ai/langchain
release tool
langchain-fireworks==1.1.0

langchain-fireworks==1.1.0

この記事は、langchain-fireworksのバージョン1.1.0のリリースに関する情報を提供しています。このリリースでは、いくつかの変更が行われており、主な内容には、テスト済みモデルの更新、ドキュメント内の参照の構文エラーの修正、データをパッケージ間で分配する機能の追加、README.mdファイルの更新、スタイルのクリーンアップ、パッケージのバージョン変更の属性付与、pyproject.tomlのURLエントリの更新が含まれています。これにより、ユーザーは最新の機能と修正を利用できるようになります。 • langchain-fireworksのバージョン1.1.0がリリースされた • テスト済みモデルの更新が行われた • ドキュメント内の参照の構文エラーが修正された • データをパッケージ間で分配する機能が追加された • README.mdファイルが更新された • スタイルのクリーンアップが実施された • パッケージのバージョン変更の属性付与が行われた • pyproject.tomlのURLエントリが更新された

langchain-ai/langchain
release tool
Claude Opus 4.5 now available in Vercel AI Gateway

Claude Opus 4.5 now available in Vercel AI Gateway

You can now access Anthropic's latest model Claude Opus 4.5 in Vercel AI Gateway with no other provider accounts required.

Vercel Blog
api cloud tool
No Image

GPT-5 and the future of mathematical discovery

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
No Image

Introducing shopping research in ChatGPT

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

OpenAI Blog
tool
'Unified FP8: Moving Beyond Mixed Precision for Stable and Accelerated MoE RL'

'Unified FP8: Moving Beyond Mixed Precision for Stable and Accelerated MoE RL'

<blockquote> <p>TL;DR: We have implemented fully FP8-based sampling and training in RL. Experiments show that for MoE models, the larger the model, the more ...

LMSYS Blog
tool
Release v3.34.1

Release v3.34.1

RooCodeIncのRoo-Codeのリリースv3.34.1では、いくつかの重要な改善が行われた。主な変更点には、UIにおける画像生成のプロンプト表示機能の追加、TODOリストの重複表示問題の修正、クラウド同期メッセージのトラッキング機能の追加、評価時にRoo Code Cloudプロバイダーを有効にすることが含まれる。これらの改善により、ユーザーエクスペリエンスが向上し、機能の信頼性が高まることが期待される。 • UIに画像生成のプロンプト表示機能を追加 • TODOリストの重複表示問題を修正 • クラウド同期メッセージのトラッキング機能を追加 • 評価時にRoo Code Cloudプロバイダーを有効にする

RooCodeInc/Roo-Code
release tool
🥇Top AI Papers of the Week

🥇Top AI Papers of the Week

The Top AI Papers of the Week (November 17 - 23)

Elvis Saravia's NLP Blog
library tool
No Image

Agent design is still hard

Armin Ronacher presents a cornucopia of lessons learned from building agents over the past few months. There are several agent abstraction libraries available now (my own LLM library is edging …

Simon Willison's Blog
api tool
LMSYS Fellowship Program

LMSYS Fellowship Program

<p>We're proud to launch the LMSYS Fellowship Program!</p> <p>This year, the program will provide funding to full-time PhD students in the United States who ...

LMSYS Blog
tool
Olmo 3 is a fully open LLM

Olmo 3 is a fully open LLM

Olmo is the LLM series from Ai2—the Allen institute for AI. Unlike most open weight models these are notable for including the full training data, training process and checkpoints along …

Simon Willison's Blog
library tool
langchain-tests==1.0.2

langchain-tests==1.0.2

この記事は、Langchainのテストパッケージであるlangchain-testsのバージョン1.0.2のリリースに関する情報を提供しています。このリリースでは、いくつかの変更が行われており、主な内容には、ドキュメントの参照の構文エラーの修正、Anthropicのネイティブ構造化出力機能と厳密なツール呼び出しのサポート、ミドルウェアの参照構文の修正、CLIや標準テスト、テキスト分割器に関するRuff TCルールの修正、コードのクリーンアップが含まれています。これらの変更は、Langchainの機能性と使いやすさを向上させることを目的としています。 • langchain-testsのバージョン1.0.2がリリースされた • ドキュメントの参照の構文エラーが修正された • Anthropicのネイティブ構造化出力機能がサポートされた • 厳密なツール呼び出しが追加された • ミドルウェアの参照構文が修正された • CLIや標準テスト、テキスト分割器に関するRuff TCルールが修正された • コードのクリーンアップが行われた

langchain-ai/langchain
release tool
🤖AI Agents Weekly: Gemini 3, Nano Banana Pro, Antigravity, Agent-R1 RL Framework, Meta's SAM 3, OLMo 3

🤖AI Agents Weekly: Gemini 3, Nano Banana Pro, Antigravity, Agent-R1 RL Framework, Meta's SAM 3, OLMo 3

Gemini 3, Nano Banana Pro, Antigravity, Agent-R1 RL Framework, Meta's SAM 3, OLMo 3

Elvis Saravia's NLP Blog
platform
Release v3.34.0

Release v3.34.0

RooCodeIncのRoo-Codeのリリースv3.34.0では、ブラウザのインタラクション機能を強化したBrowser Use 2.0の追加や、新しいAIプロバイダーBasetenのサポートが含まれています。また、OpenAI互換プロバイダーのエラーハンドリングと設定の改善、オンボーディング体験を向上させるためのプロバイダー指向のウェルカム画面の追加、プロバイダーリストの上部にRooプロバイダーを固定することでの発見性の向上が行われました。さらに、ネイティブツールの説明を例や明確化で強化し、ストリーミング中のキャンセルボタンの即時応答性を修正、以前の変更からのパフォーマンス回帰を解決するための修正、モデルキャッシュのリフレッシュを実装して古いディスクキャッシュの問題を防ぐなどの改善が行われています。 • ブラウザのインタラクション機能を強化したBrowser Use 2.0を追加 • 新しいAIプロバイダーBasetenをサポート • OpenAI互換プロバイダーのエラーハンドリングと設定を改善 • プロバイダー指向のウェルカム画面を追加し、オンボーディング体験を向上 • Rooプロバイダーをプロバイダーリストの上部に固定し、発見性を向上 • ネイティブツールの説明を例や明確化で強化 • ストリーミング中のキャンセルボタンの即時応答性を修正 • モデルキャッシュのリフレッシュを実装し、古いディスクキャッシュの問題を防止

RooCodeInc/Roo-Code
api release tool
langchain-model-profiles==0.0.5

langchain-model-profiles==0.0.5

この記事は、GitHub上で公開されたlangchain-model-profilesのバージョン0.0.5のリリースに関する情報を提供しています。このリリースでは、パッケージ間でデータを分配する機能が追加され、README.mdファイルの更新も行われました。リリース日は2023年11月21日で、前のバージョン0.0.4からの変更点が記載されています。 • 新機能として、データをパッケージ間で分配する機能が追加された • README.mdファイルが更新された • リリース日は2023年11月21日 • 前のバージョン0.0.4からの変更点が含まれている

langchain-ai/langchain
release tool
langchain-core==1.1.0

langchain-core==1.1.0

この記事は、Langchainのコアライブラリのバージョン1.1.0のリリースについて説明しています。このリリースは2023年11月21日に行われ、主な変更点として、モデルプロファイルに関する機能が追加され、データをパッケージ間で分散させることが可能になりました。これにより、データ管理がより効率的に行えるようになります。リリースはGitHub上で行われ、コミットはGitHubの検証済み署名で作成されています。 • Langchainのコアライブラリのバージョン1.1.0がリリースされた。 • リリース日は2023年11月21日。 • 新機能として、モデルプロファイルに関する機能が追加された。 • データをパッケージ間で分散させることが可能になった。 • データ管理の効率が向上する。

langchain-ai/langchain
library release
Streamline AI operations with the Multi-Provider Generative AI Gateway reference architecture

Streamline AI operations with the Multi-Provider Generative AI Gateway reference architecture

In this post, we introduce the Multi-Provider Generative AI Gateway reference architecture, which provides guidance for deploying LiteLLM into an AWS environment to streamline the management and governance of production generative AI workloads across multiple model providers. This centralized gateway solution addresses common enterprise challenges including provider fragmentation, decentralized governance, operational complexity, and cost management by offering a unified interface that supports Amazon Bedrock, Amazon SageMaker AI, and external providers while maintaining comprehensive security, monitoring, and control capabilities.

AWS Machine Learning Blog
api cloud tool
How agents can use filesystems for context engineering

How agents can use filesystems for context engineering

A key feature of deep agents is their access to a set of filesystem tools. Deep agents can use these tools to read, write, edit, list, and search for files in their filesystem. In this post, we’ll walk through why we think filesystems are important for agents. In order

LangChain Blog
tool
Deploy geospatial agents with Foursquare Spatial H3 Hub and Amazon SageMaker AI

Deploy geospatial agents with Foursquare Spatial H3 Hub and Amazon SageMaker AI

In this post, you'll learn how to deploy geospatial AI agents that can answer complex spatial questions in minutes instead of months. By combining Foursquare Spatial H3 Hub's analysis-ready geospatial data with reasoning models deployed on Amazon SageMaker AI, you can build agents that enable nontechnical domain experts to perform sophisticated spatial analysis through natural language queries—without requiring geographic information system (GIS) expertise or custom data engineering pipelines.

AWS Machine Learning Blog
api cloud tool
Reward hacking: a potential source of serious Al misalignment

Reward hacking: a potential source of serious Al misalignment

We discuss our new paper, "Natural emergent misalignment from reward hacking in production RL". In this paper, we show for the first time that realistic AI training processes can accidentally produce misaligned models. Specifically, when large language models learn to cheat on software programming tasks, they go on to display other, even more misaligned behaviors as an unintended consequence. These include concerning behaviors like alignment faking and sabotage of AI safety research. 00:00 Introduction 00:42 What is this work about? 5:21 How did we run our experiment? 14:48 Detecting models' misalignment 22:17 Preventing misalignment from reward hacking 37:15 Alternative strategies 42:03 Limitations 44:25 How has this study changed our views? 50:31 Takeaways for people interested in conducting AI safety research

YouTube Anthropic
Reducing EV range anxiety: How a simple AI model predicts port availability

Reducing EV range anxiety: How a simple AI model predicts port availability

この記事では、電気自動車(EV)の充電ポートの利用可能性を予測するためのシンプルなAIモデルについて説明しています。このモデルは、特定の充電ステーションでのポートの利用可能性を、現在の時刻から数分後に予測することができ、EVドライバーが効率的に旅行を計画し、充電ステーションでの待機時間を最小限に抑えるのに役立ちます。EVの普及が進む中、信頼性の高い充電インフラの構築が求められています。記事では、充電ステーションをナビゲーションルートに統合することで、EVドライバーの「航続距離不安」を軽減するアプローチが紹介されています。モデルは、シンプルな線形回帰アプローチに基づいており、リアルタイムの利用可能データを使用してトレーニングされています。特に、時間帯を特徴として扱い、各時間帯のポートの占有率の変化を予測するための重みを学習します。 • EV充電ポートの利用可能性を予測するAIモデルを開発した。 • モデルは、特定の充電ステーションでのポートの利用可能性を数分後に予測する。 • 充電ステーションをナビゲーションルートに統合することで、航続距離不安を軽減する。 • シンプルな線形回帰アプローチを使用し、リアルタイムのデータでトレーニングされた。 • 時間帯を特徴として扱い、各時間帯のポートの占有率の変化を予測するための重みを学習する。

Google Research
api tool
How Wipro PARI accelerates PLC code generation using Amazon Bedrock

How Wipro PARI accelerates PLC code generation using Amazon Bedrock

In this post, we share how Wipro implemented advanced prompt engineering techniques, custom validation logic, and automated code rectification to streamline the development of industrial automation code at scale using Amazon Bedrock. We walk through the architecture along with the key use cases, explain core components and workflows, and share real-world results that show the transformative impact on manufacturing operations.

AWS Machine Learning Blog
tool
16 Google AI tips for stress-free holiday hosting in 2025

16 Google AI tips for stress-free holiday hosting in 2025

Use Gemini, Search, Pixel and more to make holiday planning feel effortless in 2025.

Google AI Blog
tool
Self-driving infrastructure

Self-driving infrastructure

At Vercel, we’re building self-driving infrastructure, a system that autonomously manages production operations, improves application code using real-world insights, and learns from the unpredictable nature of production itself.

Vercel Blog
api cloud tool
Release v3.33.3

Release v3.33.3

RooCodeIncのRoo-Codeリポジトリでのリリースv3.33.3では、いくつかの新機能と修正が行われた。新たにGoogle Gemini 3 Proの画像プレビューが画像生成モデルに追加され、MinimaxがAnthropic互換プロバイダーとしてサポートされるようになった。また、すべてのプロバイダーに対して会話履歴に推論を保存する機能が追加された。APIの推論を含めるためのpreserveReasoningフラグの改善や、OpenAI Nativeの並列ツール呼び出しを防ぐ修正も行われた。さらに、シンボルの検索と置換の解析を改善し、ネイティブプロトコルでスキップされたツールのtool_resultブロックを送信する修正も含まれている。マークダウンのフォーマット改善や、キャンセルされたタスクの再開時に環境詳細の重複を防ぐ修正も行われた。 • Google Gemini 3 Proの画像プレビューを画像生成モデルに追加 • MinimaxをAnthropic互換プロバイダーとしてサポート • すべてのプロバイダーに対して会話履歴に推論を保存する機能を追加 • preserveReasoningフラグの改善によりAPI推論の含め方を制御 • OpenAI Nativeの並列ツール呼び出しを防ぐ修正 • シンボルの検索と置換の解析を改善 • スキップされたツールのtool_resultブロックを送信する修正 • マークダウンフォーマットの改善と推論サポートの追加 • キャンセルされたタスクの再開時に環境詳細の重複を防ぐ修正

RooCodeInc/Roo-Code
release tool
Scania accelerates operations across its global workforce with ChatGPT

Scania accelerates operations across its global workforce with ChatGPT

Scania builds the trucks, buses, and transport systems that keep the world moving. With AI in their engineering-led organisation, they're evolving from vehicle maker to sustainable transport ecosystem leader. Read more: https://openai.com/index/scania/

YouTube OpenAI
20x Faster TRL Fine-tuning with RapidFire AI

20x Faster TRL Fine-tuning with RapidFire AI

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
library tool
Open ASR Leaderboard: Trends and Insights with New Multilingual & Long-Form Tracks

Open ASR Leaderboard: Trends and Insights with New Multilingual & Long-Form Tracks

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Hugging Face Blog
api library tool
Develop a deeper understanding with interactive images in Gemini.

Develop a deeper understanding with interactive images in Gemini.

Learning science consistently shows us that true learning requires active engagement. This is fundamental to how Gemini helps you learn. Going beyond simple text and sta…

Google AI Blog
tool ui
No Image

Newsroom

この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • AIの学習能力による精度向上

Anthropic News
ai anthropic llm
Turning Claude into your thinking partner

Turning Claude into your thinking partner

We’ve shipped a lot of new features in Claude over the past few months—memory, voice, file creation, and more. Together, they add up to something bigger: Claude as a thinking partner. Now, Claude isn’t just answering questions but staying with you through the messy process of thinking and building. Here’s how it works. Memory: https://youtu.be/PupmfSttxlc Chrome Extension: https://youtu.be/mCj4kx_P2Ak File creation: https://youtu.be/EV89Ws8Ui9Y Mobile & Desktop: https://claude.com/download

YouTube Anthropic
MSD explores applying generative Al to improve the deviation management process using AWS services

MSD explores applying generative Al to improve the deviation management process using AWS services

This blog post has explores how MSD is harnessing the power of generative AI and databases to optimize and transform its manufacturing deviation management process. By creating an accurate and multifaceted knowledge base of past events, deviations, and findings, the company aims to significantly reduce the time and effort required for each new case while maintaining the highest standards of quality and compliance.

AWS Machine Learning Blog
tool
Accelerating genomics variant interpretation with AWS HealthOmics and Amazon Bedrock AgentCore

Accelerating genomics variant interpretation with AWS HealthOmics and Amazon Bedrock AgentCore

In this blog post, we show you how agentic workflows can accelerate the processing and interpretation of genomics pipelines at scale with a natural language interface. We demonstrate a comprehensive genomic variant interpreter agent that combines automated data processing with intelligent analysis to address the entire workflow from raw VCF file ingestion to conversational query interfaces.

AWS Machine Learning Blog
api tool
How Rufus scales conversational shopping experiences to millions of Amazon customers with Amazon Bedrock

How Rufus scales conversational shopping experiences to millions of Amazon customers with Amazon Bedrock

Our team at Amazon builds Rufus, an AI-powered shopping assistant which delivers intelligent, conversational experiences to delight our customers. More than 250 million customers have used Rufus this year. Monthly users are up 140% YoY and interactions are up 210% YoY. Additionally, customers that use Rufus during a shopping journey are 60% more likely to […]

AWS Machine Learning Blog
tool
How AI Is Accelerating Scientific Discovery Today and What's Ahead — the OpenAI Podcast Ep. 10

How AI Is Accelerating Scientific Discovery Today and What's Ahead — the OpenAI Podcast Ep. 10

AI is beginning to change how science gets done. Head of OpenAI for Science Kevin Weil and OpenAI research scientist Alex Lupsasca talk about the early signs of acceleration researchers are seeing with GPT-5—from surfacing literature across fields and languages, to speeding up complex calculations, to designing follow-up experiments. They unpack what’s possible today, what doesn’t work yet, and why the next few years could reshape the trajectory of scientific progress across physics, math, biology and beyond. Chapters: - 00:00:40 — OpenAI for Science mission - 00:06:00 — Literature search and intersections across fields - 00:11:19 — A fusion physicist shows what GPT-5 can do - 00:15:08 — GPT-5 Pro and black hole symmetries - 00:19:02 — Getting the most out of the models - 00:24:33 — OpenAI’s new research paper (https://openai.com/index/accelerating-science-gpt-5/) - 00:29:59 — Looking ahead to the next 5 years - 00:32:05 — Will predictions outpace experiments? - 00:36:43 — The pace of model improvement - 00:40:31 — What do scientific benchmarks look like? - 00:44:16 — Fusion and the promise of abundant energy - 00:48:07 — Closing: Science 2.0 moment

YouTube OpenAI
prebuilt==1.0.5

prebuilt==1.0.5

この記事は、GitHub上のlangchain-ai/langgraphリポジトリにおけるprebuilt==1.0.5のリリースについて説明しています。このリリースは2023年11月20日に行われ、主な変更点として、関数シグネチャを尊重するようにインジェクションロジックをリファクタリングしたこと、ToolCallRequestにおけるsetattrの非推奨化が含まれています。これにより、より安定した動作が期待されます。 • リリース日: 2023年11月20日 • 主な変更点: インジェクションロジックのリファクタリング • ToolCallRequestにおけるsetattrの非推奨化 • 関数シグネチャを尊重する改善 • 安定性の向上が期待される

langchain-ai/langgraph
release tool
Nano Banana Pro aka gemini-3-pro-image-preview is the best available image generation model

Nano Banana Pro aka gemini-3-pro-image-preview is the best available image generation model

Hot on the heels of Tuesday’s Gemini 3 Pro release, today it’s Nano Banana Pro, also known as Gemini 3 Pro Image. I’ve had a few days of preview access …

Simon Willison's Blog
api tool
How Care Access achieved 86% data processing cost reductions and 66% faster data processing with Amazon Bedrock prompt caching

How Care Access achieved 86% data processing cost reductions and 66% faster data processing with Amazon Bedrock prompt caching

In this post, we demonstrate how healthcare organizations can securely implement prompt caching technology to streamline medical record processing while maintaining compliance requirements.

AWS Machine Learning Blog
api cloud tool