Last updated: 2026/04/15 15:01
この記事は、langchain-openaiライブラリのバージョン1.1.13のリリースに関する情報を提供しています。このリリースでは、OpenAI APIのレスポンスにおいて、タイプキーがないコンテンツブロックを処理する修正が行われました。また、モデルプロファイルデータの更新や、ドキュメント内の誤字修正も含まれています。さらに、OpenAIファイル入力のためのプレースホルダーファイル名の補完機能が追加され、ユーザー提供のUser-AgentがAzureのデフォルトを上書きできるようになりました。これにより、APIの使用における柔軟性が向上しています。 • OpenAI APIのレスポンスにおいて、タイプキーがないコンテンツブロックを処理する修正が行われた。 • モデルプロファイルデータの更新が行われた。 • ドキュメント内の誤字が修正された。 • OpenAIファイル入力のためのプレースホルダーファイル名の補完機能が追加された。 • ユーザー提供のUser-AgentがAzureのデフォルトを上書きできるようになった。
The conversation about AI and coding work is full of highs. These models are incredible! I’m so productive. I’m not blocked by a lack of knowledge in certain areas like I used to get. I’m making projects I never would have gotten around to making. I’m having fun with code for the first time in […]

Smaller specialized models can match or beat frontier generalists on the tasks they're trained for. Working with Applied Compute, we RL-trained SWE-check, a bug detection model that matches Opus 4.6 on our internal evals while running ~10x faster.
OpenAI's answer to Claude Mythos appears to be a new model called GPT-5.4-Cyber: In preparation for increasingly more capable models from OpenAI over the next few months, we are fine-tuning …
この記事は、GitHub上でのlangchain-coreのバージョン1.2.29のリリースに関する情報を提供しています。このリリースは2023年4月14日に行われ、前のバージョン1.2.28からの変更点が含まれています。具体的には、コミット479a255が作成され、GitHubの検証済み署名で署名されています。リリースノートには、バージョン1.2.29における変更点や修正が記載されていますが、詳細な内容は示されていません。 • GitHubでのlangchain-coreのバージョン1.2.29のリリース情報 • リリース日は2023年4月14日 • 前のバージョン1.2.28からの変更点が含まれている • コミット479a255が作成され、GitHubの検証済み署名で署名されている • 具体的な変更内容はリリースノートに記載されているが、詳細は不明
The UK's AI Safety Institute recently published Our evaluation of Claude Mythos Preview’s cyber capabilities, their own independent analysis of Claude Mythos which backs up Anthropic's claims that it is …

In this post, we introduce the Generative AI Path-to-Value (P2V) framework, a structured approach to help you move generative AI initiatives from concept to production and sustained value creation.

We're excited to announce the launch of Amazon SageMaker JumpStart optimized deployments. SageMaker JumpStart improved deployments address the need for rich and straightforward deployment customization on SageMaker JumpStart by offering pre-defined deployment configurations, designed for specific use cases. Customers maintain the same level of visibility into the details of their proposed deployments, but now deployments are optimized for their specific use case and performance constraint.
この記事は、GitHub上で公開されているlanggraphのバージョン1.1.7a2のリリースに関する情報を提供しています。このリリースでは、依存関係の更新としてpytestが9.0.2から9.0.3にバージョンアップされ、トレーシング目的のメタデータの一部を渡すことが可能になりました。また、設定からassistant_idをメタデータではなく構成から取得するように修正されています。これにより、langgraphの機能が向上し、より柔軟な設定が可能になっています。 • 依存関係の更新としてpytestが9.0.2から9.0.3にバージョンアップされた。 • トレーシング目的のメタデータの一部を渡すことが可能になった。 • assistant_idをメタデータではなく設定から取得するように修正された。 • これにより、langgraphの機能が向上し、柔軟な設定が可能になった。

This post explores how Amazon SageMaker HyperPod provides a comprehensive solution for inference workloads. We walk you through the platform’s key capabilities for dynamic scaling, simplified deployment, and intelligent resource management. By the end of this post, you’ll understand how to use the HyperPod automated infrastructure, cost optimization features, and performance enhancements to reduce your total cost of ownership by up to 40% while accelerating your generative AI deployments from concept to production.

In this post, we walk through how Guidesly built Jack AI on AWS using AWS Lambda, AWS Step Functions, Amazon Simple Storage Service (Amazon S3), Amazon Relational Database Service (Amazon RDS), Amazon SageMaker AI, and Amazon Bedrock to ingest trip media, enrich it with context, apply computer vision and generative AI, and publish marketing-ready content across multiple channels—securely, reliably, and at scale.
Skills in Chrome let you discover, save and remix AI workflows — and repeat them instantly.

We were able to create a JavaScript runtime just in two weeks. Without Codex, it would have taken us easily one year." Syrus Akbary Nieto, founder and CEO of Wasmer has been stress testing Codex, assigning complex, long running tasks. "We are actually moving out of the IDE itself. We're not touching as much the code, we're just guiding it where we want it to go." #shotsvideo #codex #openaicodex Learn more: https://openai.com/codex/

"We were able to create a JavaScript runtime just in two weeks. Without Codex, it would have taken us easily one year." Syrus Akbary Nieto, founder and CEO of Wasmer has been stress testing Codex, assigning complex, long running tasks. 🚀 It's been a game changer. "We are actually moving out of the IDE itself. We're not touching as much the code, we're just guiding it where we want it to go." Learn more: https://openai.com/codex/

With the new Spring AI AgentCore SDK, you can build production-ready AI agents and run them on the highly scalable AgentCore Runtime. The Spring AI AgentCore SDK is an open source library that brings Amazon Bedrock AgentCore capabilities into Spring AI. In this post, we build an AI agent starting with a chat endpoint, then adding streaming responses, conversation memory, and tools for web browsing and code execution.

Google is bringing people together in Washington D.C. at our AI for the Economy Forum.

OpenAI expands its Trusted Access for Cyber program, introducing GPT-5.4-Cyber to vetted defenders and strengthening safeguards as AI cybersecurity capabilities advance.
RooCodeIncのGitHubリポジトリで、バージョン3.52.1がリリースされたことが発表されました。このリリースは2022年4月13日に行われ、リリースノートには新機能や修正点が含まれている可能性がありますが、具体的な内容は記載されていません。リリースに関連するアセットも提供されていますが、詳細は不明です。ユーザーはGitHubのインターフェースを通じて、リリースの通知設定を変更する必要があります。 • RooCodeIncのリポジトリでバージョン3.52.1がリリースされた。 • リリース日は2022年4月13日。 • リリースノートには新機能や修正点が含まれる可能性があるが、具体的な内容は記載されていない。 • リリースに関連するアセットが提供されているが、詳細は不明。 • ユーザーはGitHubで通知設定を変更する必要がある。
The TL;DR is that Google engineering appears to have the same AI adoption footprint as John Deere, the tractor company. Most of the industry has the same internal adoption curve: …

本研究は、生成AIを活用して「未来に備えた」スキルを評価する新しいアプローチを示しています。ニューヨーク大学との共同研究により、AIによる評価が人間の専門家と同等であることが確認されました。この研究実験「Vantage」は、Google Labsで利用可能です。AIの進化に伴い、批判的思考や協力、創造的思考などの持続可能な人間の能力がますます重要視されています。Vantageは、高校生や大学生がシミュレーション環境でスキルを練習し、評価を受けるためのサンドボックスを提供します。AIアバターとの動的な会話を通じて、学生は実世界に近いシナリオでスキルを示す機会を得ます。 • 生成AIを用いた未来に備えたスキルの評価方法を提案 • AI評価が人間の専門家と同等であることを確認 • Vantageは高校生や大学生向けのシミュレーション環境を提供 • AIアバターとの会話を通じてスキルを評価 • 動的な会話環境での実世界に近いシナリオを再現 • 評価基準に基づいてAIが会話を導く • 教育者が授業をスキルに合わせて調整できるよう支援
この記事は、Hugging FaceのTransformersライブラリのバージョン5.5.4のパッチリリースについて説明しています。このリリースでは、主にトークナイザーに関するいくつかの修正が行われました。具体的には、Kimi-K2.5トークナイザーの回帰修正や、DeepSpeed ZeRO-3を使用している際のIndexErrorの修正が含まれています。また、Qwen2.5-VLに関しては、静止画像に適用されるRoPEスケーリングの修正も行われました。これらの修正は、トレーニングの安定性やパフォーマンスを向上させることを目的としています。 • Kimi-K2.5トークナイザーの回帰修正が行われた。 • DeepSpeed ZeRO-3使用時のIndexErrorが修正された。 • Qwen2.5-VLの静止画像に対するRoPEスケーリングの修正が行われた。 • これらの修正はトレーニングの安定性を向上させることを目的としている。 • パッチリリースは迅速な修正を提供するために行われた。

This post demonstrates how Lambda enables scalable, cost-effective reward functions for Amazon Nova customization. You'll learn to choose between Reinforcement Learning via Verifiable Rewards (RLVR) for objectively verifiable tasks and Reinforcement Learning via AI Feedback (RLAIF) for subjective evaluation, design multi-dimensional reward systems that help you prevent reward hacking, optimize Lambda functions for training scale, and monitor reward distributions with Amazon CloudWatch. Working code examples and deployment guidance are included to help you start experimenting.
Gemini Robotics ER 1.6 upgrades spatial reasoning and multi-view understanding, unlocking new capabilities like instrument reading for autonomous robots.

第 202 回のテーマは 2026 年 4 月の Monthly Ecosystem です。
この記事は、Langchainのコアライブラリのバージョン1.3.0a2のリリースに関する情報を提供しています。このリリースでは、ガーベジコレクションをサポートするために、継承された実行ツリーを格納するための参照カウントを使用する修正が含まれています。また、ドキュメントの改善や、OpenAIファイル入力のためのプレースホルダファイル名の補完機能が追加されています。さらに、いくつかのバグ修正や、非推奨のメソッドの処理に関する改善も行われています。これにより、Langchainの機能が向上し、ユーザーにとっての利便性が増しています。 • ガーベジコレクションをサポートするための参照カウントの使用 • OpenAIファイル入力のためのプレースホルダファイル名の補完機能の追加 • ドキュメントの改善 • 非推奨のメソッドの処理に関するバグ修正 • ユーザーにとっての利便性の向上

AI-powered tools are being used to bring greater efficiency and security to healthcare around the world and increase access to medicines and care.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントやコードの一部を基に、AIが適切なコードを提案する機能があります。また、ツールは多くのプログラミング言語に対応しており、特にJavaScriptやPythonでの利用が推奨されています。これにより、開発者は生産性を向上させ、エラーを減少させることが期待されます。さらに、ユーザーインターフェースも直感的で使いやすく設計されています。 • AIを活用したコード自動生成ツールの紹介 • 開発者が入力したコメントに基づいてコードを提案 • JavaScriptやPythonなど多くの言語に対応 • 生産性向上とエラー削減が期待される • 直感的で使いやすいユーザーインターフェース
The problem is that LLMs inherently lack the virtue of laziness. Work costs nothing to an LLM. LLMs do not feel a need to optimize for their own (or anyone's) …
Thanks to a tip from Rahim Nathwani, here's a uv run recipe for transcribing an audio file on macOS using the 10.28 GB Gemma 4 E2B model with MLX and …

The Top AI Papers of the Week (April 6 - April 12)

Claude Managed Agents, Muse Spark, Project Glasswing, Advisor Strategy, GLM-5.1, Memento, and More

Agent harnesses are becoming the dominant way to build agents, and they are not going anywhere. These harnesses are intimately tied to agent memory. If you used a closed harness - especially if it’s behind a proprietary API - you are choosing to yield control of your agent’s

Claude に新たに追加された advisor tool を使用すると、通常のタスクは軽量モデルに任せつつ、必要に応じて高性能モデルに相談することで、性能とコストのバランスを最適化できます。この記事では Claude Code 内で advisor tool を活用する方法について紹介します。
この記事は、langgraphのバージョン1.1.7a1のリリースに関する情報を提供しています。このリリースでは、いくつかの重要な変更が行われました。まず、フレークなストリーミングテストにおいてモノトニッククロックを使用するようにテストが更新されました。また、グラフライフサイクルコールバックハンドラが追加され、依存関係としてcryptographyライブラリが46.0.6から46.0.7にバージョンアップされました。さらに、コーディングスタイルの整合性を保つためのリントの更新や、uvロックの解決に関する作業も行われています。 • langgraphのバージョン1.1.7a1がリリースされた • フレークなストリーミングテストにモノトニッククロックを使用するように変更された • グラフライフサイクルコールバックハンドラが追加された • cryptographyライブラリが46.0.6から46.0.7にバージョンアップされた • コーディングスタイルの整合性を保つためのリントの更新が行われた

Lenny posted another snippet from our 1 hour 40 minute podcast recording and it's about kākāpō parrots!

Builders Unscripted spotlights the stories behind real projects and the mindset that makes them possible: you can just build things. In this episode, Romain Huet, Head of Developer Experience, chats with Ashe Magalhaes, founder of Hearth AI. Ashe talks about moving fast with Codex, finding beauty in tools, and gives a keen look into her agentic personal operating systems that enable her to feel more present, connected, and intentional. Chapters: 00:00 Intro 00:10 Early agents and Hearth AI 05:43 AI and human connection 08:44 Build in public 12:17 Ashe’s agentic workflow
この記事は、Langchainのコアライブラリのバージョン1.3.0a1のリリースに関する情報を提供しています。このリリースでは、ストリーミングメタデータの削減やパフォーマンスの向上が図られています。また、テンプレートのサニタイズを強化し、非推奨のプロンプト保存パスにおけるシンボリックリンクの処理を改善しました。さらに、OpenAIファイル入力のためのプレースホルダファイル名の補完機能が追加され、エラーメッセージの改善やドキュメントの修正も行われています。これにより、Langchainの使用がより安全で効率的になることが期待されます。 • Langchainのコアライブラリのバージョン1.3.0a1がリリースされた。 • ストリーミングメタデータの削減とパフォーマンス向上が行われた。 • テンプレートのサニタイズが強化された。 • 非推奨のプロンプト保存パスにおけるシンボリックリンクの処理が改善された。 • OpenAIファイル入力のためのプレースホルダファイル名の補完機能が追加された。
I think it's non-obvious to many people that the OpenAI voice mode runs on a much older, much weaker model - it feels like the AI that you can talk …

AI-generated tests can speed up React testing, but they also create hidden risks. Here’s what broke in a real app.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や修正を行うことができます。具体的には、開発者が意図する機能を自然言語で入力すると、ツールがそれに基づいてコードを生成します。また、既存のコードに対しても改善提案を行う機能があります。これにより、開発の効率が向上し、エラーの削減が期待されます。さらに、ツールは多くのプログラミング言語に対応しており、幅広い開発環境で利用可能です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での入力に基づくコードの自動生成機能 • 既存コードへの改善提案機能 • 開発効率の向上とエラー削減の期待 • 多くのプログラミング言語に対応している

Learn how sales teams use ChatGPT to research accounts, personalize outreach, manage deals, and improve pipeline and conversion.

Learn how to create and refine images with ChatGPT using clear prompts, iterate on designs, and generate high-quality visuals in minutes.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や修正を行うことができます。具体的には、開発者が意図する機能を自然言語で入力すると、ツールがそれに基づいてコードを生成します。また、既存のコードに対しても改善提案を行うことができ、開発効率を大幅に向上させることが期待されています。さらに、ツールは多くのプログラミング言語に対応しており、さまざまな開発環境で利用可能です。 • AIを活用したコード自動生成ツールの紹介 • 自然言語での入力に基づくコード生成機能 • 既存コードへの改善提案機能 • 多言語対応でさまざまな開発環境で利用可能 • 開発効率の向上が期待される
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントや関数名に基づいて、AIが適切なコードを提案する機能があります。また、ツールは多くのプログラミング言語に対応しており、特にJavaScriptやPythonでの利用が推奨されています。これにより、開発者は生産性を向上させ、エラーを減少させることが期待されます。さらに、ユーザーインターフェースも直感的で使いやすく設計されています。 • AIを活用したコード自動生成ツールの紹介 • 開発者が入力した内容に基づいてコードを提案する機能 • JavaScriptやPythonなど多くの言語に対応 • 生産性向上とエラー削減が期待される • 直感的で使いやすいユーザーインターフェース
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や修正を行うことができます。具体的には、開発者が意図する機能を自然言語で入力すると、ツールがそれに基づいてコードを生成します。また、既存のコードに対しても改善提案を行う機能があります。これにより、開発の効率が向上し、エラーの削減が期待されます。さらに、ツールは多くのプログラミング言語に対応しており、幅広い開発環境で利用可能です。 • AIを活用したコード自動生成ツールの紹介 • 自然言語で機能を入力することでコードを生成 • 既存コードへの改善提案機能 • 開発効率の向上とエラー削減が期待される • 多くのプログラミング言語に対応している

Learn how to use ChatGPT, start your first conversation, and discover simple ways to write, brainstorm, and solve problems with AI.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントや関数名に基づいて、AIが適切なコードを提案する機能があります。また、ツールは多くのプログラミング言語に対応しており、特にJavaScriptやPythonでの利用が推奨されています。これにより、開発者はコーディングの効率を大幅に向上させることができ、エラーの削減や開発時間の短縮が期待されます。 • AIを活用したコード自動生成ツールの紹介 • 開発者が入力した情報に基づいてコードを提案する機能 • JavaScriptやPythonなど多くの言語に対応 • コーディング効率の向上が期待される • エラー削減や開発時間短縮のメリット
この記事では、医療現場におけるAIの活用方法について説明しています。特に、ChatGPT for Healthcareが医療従事者向けに設計された安全な作業空間であり、HIPAAに準拠した使用が可能であることが強調されています。このツールは、臨床文書の作成、事前承認の準備、患者情報の要約など、医療従事者の業務を支援し、管理業務の負担を軽減し、患者ケアに集中できるようにします。具体的な使用例として、診断テストの選択、鑑別診断の作成、治療計画の策定に関するプロンプトが示されており、これにより医療従事者が日常業務を効率化できることが示されています。 • AIが医療現場での業務を支援する具体的な方法を示している • ChatGPT for HealthcareはHIPAA準拠の安全な作業空間である • 臨床文書作成や患者情報の要約などのタスクを支援する • 診断テストの選択や鑑別診断の作成に役立つプロンプトが提供されている • 医療従事者が業務を効率化し、患者ケアに集中できるようにする効果がある
ChatGPTでは、ファイルを直接アップロードして会話の中で分析、編集、生成が可能です。ユーザーは、ツールメニューから「写真やファイルを追加」を選択し、CSV、XLSX、PDF、DOCX、JPEG、PNG、TXTなどの形式のファイルをアップロードできます。アップロード後、レポートの要約やリスクの指摘、データの視覚化、文書の書き直し、PDFからのデータ抽出などのタスクを依頼できます。また、特定のビュー(テーブルやチャート)をリクエストしたり、ChatGPTが生成した出力をダウンロードすることも可能です。さらに、一部のChatGPTバージョンでは、外部ツールに接続するアプリを使用でき、会話に外部のコンテキストを持ち込むことができます。エンタープライズワークスペースでは、管理者が利用可能なアプリを制御します。アプリを通じてアクセスされたデータは、デフォルトではOpenAIモデルのトレーニングには使用されません。 • ChatGPTでファイルをアップロードし、分析や編集ができる機能がある。 • サポートされているファイル形式にはCSV、XLSX、PDF、DOCX、JPEG、PNG、TXTが含まれる。 • ユーザーはファイルをアップロード後、要約やデータの視覚化、文書の書き直しなどのタスクを依頼できる。 • 特定のビューをリクエストしたり、生成された出力をダウンロードすることが可能。 • 一部のバージョンでは外部ツールに接続するアプリを使用でき、外部のコンテキストを会話に持ち込むことができる。 • エンタープライズワークスペースでは、管理者が利用可能なアプリを制御し、データはデフォルトでモデルのトレーニングには使用されない。

Learn how managers use ChatGPT to prepare for conversations, write clear feedback, stay organized, and improve team effectiveness.

Learn how to create and use ChatGPT skills to build reusable workflows, automate recurring tasks, and ensure consistent, high-quality outputs.

Learn how customer success teams use ChatGPT to manage accounts, improve communication, reduce churn, and drive adoption and renewals.

Learn how to personalize ChatGPT using custom instructions and memory to get more relevant, consistent, and tailored responses.
この記事では、ChatGPTがオペレーションチームにどのように役立つかについて説明しています。オペレーションチームは情報と実行の交差点に位置し、ChatGPTは常時稼働するチーフオブスタッフのように機能します。散発的な情報を整理し、意思決定に必要な要約を提供することで、チームの作業を効率化します。具体的には、散らばった情報を明確な次のステップに変換し、ステータス更新を明確にすることで、同じ質問が繰り返されるのを防ぎます。また、定期的な業務を一貫性のあるものに保つために、標準化されたフォーマットを提供します。主な使用ケースには、運営のリズムと報告、プロセスと引き継ぎ、インシデント管理、ベンダーおよびパートナー業務、キャパシティと計画、メトリクスとデータの整合性が含まれます。オペレーションチームは、明確な運営コンテキストを提供することで、ChatGPTから最大の価値を引き出すことができます。 • オペレーションチームの情報と実行の交差点での役割を強化する。 • 散発的な情報を整理し、意思決定に必要な要約を提供する。 • ステータス更新を明確にし、同じ質問の繰り返しを防ぐ。 • 定期的な業務を標準化し、一貫性を持たせる。 • 主な使用ケースには運営のリズム、プロセス管理、インシデント管理、ベンダー業務、キャパシティ計画が含まれる。
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントや関数名に基づいて、AIが適切なコードを提案する機能があります。また、ツールは多くのプログラミング言語に対応しており、特にJavaScriptやPythonでの使用が推奨されています。これにより、開発者はコーディングの効率を大幅に向上させることができ、エラーの削減や開発時間の短縮が期待されます。 • AI技術を活用した新しい開発ツールの紹介 • コードの自動生成や補完機能を提供 • 開発者が入力したコメントや関数名に基づいて提案 • 多くのプログラミング言語に対応、特にJavaScriptやPythonが推奨 • コーディングの効率向上、エラー削減、開発時間短縮が期待される
この記事では、特定のタスクやワークフローに合わせたカスタムGPTの構築方法について説明しています。カスタムGPTは、ユーザーの指示に従い、チームのコンテキストを活用して、一貫した出力を生成することができます。これにより、繰り返し行う作業を効率化し、再説明やコピー&ペーストの手間を減らすことが可能です。カスタムGPTは、特定のニーズに基づいて設計され、ファイルのアップロードやツールの有効化が可能です。記事では、カスタムGPTの具体的な使用例や、作成手順についても詳しく説明されています。特に、定期的に行う作業や、同じプロンプトを繰り返し使用する場合に有効です。 • カスタムGPTは特定のタスクやワークフローに特化したChatGPTのバージョンである。 • カスタムGPTは、ユーザーの指示に従い、チームのコンテキストを活用して一貫した出力を生成する。 • 繰り返し行う作業を効率化し、再説明やコピー&ペーストの手間を減らすことができる。 • カスタムGPTの作成には、明確な目的を設定し、必要なフィールドを埋めることが重要である。 • 具体的な使用例として、FAQボットやライティングアシスタント、データ分析アシスタントなどが挙げられる。
この記事では、ChatGPTを効果的に活用するためのプロンプト設計の基本について説明しています。プロンプトエンジニアリングは、ChatGPTに最適な回答を得るために入力を設計・洗練するプロセスです。良いプロンプトを書くための簡単なステップとして、タスクの概要を明確にし、役立つコンテキストを提供し、理想的な出力を説明することが挙げられています。また、複雑なタスクは小さなステップに分けることや、具体的でシンプルな要求を心がけることが推奨されています。さらに、選択肢を求めたり、優先事項を設定することも重要です。 • プロンプトエンジニアリングは、ChatGPTに最適な回答を得るための入力設計プロセスである。 • 良いプロンプトを書くためには、タスクの概要、役立つコンテキスト、理想的な出力を明確にすることが重要。 • 複雑なタスクは小さなステップに分けることで、明確で焦点を絞った回答を得やすくなる。 • 具体的でシンプルな要求を心がけることで、より良い応答が得られる。 • 選択肢を求めたり、優先事項を設定することで、ChatGPTの応答をカスタマイズできる。
この記事では、ChatGPTを安全かつ効果的に使用するためのベストプラクティスが紹介されています。AIは知識労働を変革する技術であり、ChatGPTは大量のデータを基に人間のような言語を生成しますが、誤った情報を生成する可能性があるため、注意が必要です。使用者は、職場のポリシーを尊重し、重要な作業には必ず人間を関与させるべきです。また、バイアスや視点に注意し、法的、医療的、財務的なアドバイスは専門家に確認することが推奨されています。AIの使用を透明にし、他者のデータを共有する際には同意を得ることが重要です。フィードバックを提供し、最新の情報を得るために検索機能を活用することも奨励されています。 • AIの安全で効果的な使用に関するベストプラクティスを提供 • 職場のポリシーを尊重し、重要な作業には人間を関与させるべき • ChatGPTは誤った情報を生成する可能性があるため、信頼できる情報源で確認する必要がある • バイアスや視点に注意し、出力を批判的に評価することが重要 • 法的、医療的、財務的なアドバイスは専門家に確認することが推奨される • AIの使用を透明にし、他者のデータを共有する際には同意を得ることが重要 • フィードバックを提供し、最新の情報を得るために検索機能を活用することが奨励されている

Learn how to use ChatGPT for research to gather sources, analyze information, and create structured, citation-backed insights.

Learn how to use ChatGPT for writing to draft, revise, and refine content with clear structure, tone, and intent.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。特に、AIを用いたコード生成やデバッグ支援の機能が強調されており、開発者が効率的に作業を進めるための具体的な手法が紹介されています。また、これらのツールがどのようにして開発プロセスを改善し、エラーを減少させるかについても触れています。さらに、実装方法や必要な環境についての詳細も提供されており、実際のプロジェクトにどのように適用できるかが示されています。 • AI技術を活用した新しい開発ツールの紹介 • コード生成やデバッグ支援の機能が強調されている • 開発プロセスの改善とエラーの減少に寄与する • 具体的な実装方法や必要な環境についての詳細が提供されている • 実際のプロジェクトへの適用方法が示されている

Learn how to analyze data with ChatGPT by exploring datasets, generating insights, creating visualizations, and turning findings into actionable decisions.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントや関数名に基づいて、AIが適切なコードを提案する機能があります。また、ツールは多くのプログラミング言語に対応しており、特にJavaScriptやPythonでの利用が推奨されています。これにより、開発者はコーディングの効率を大幅に向上させることができ、エラーの削減や開発時間の短縮が期待されます。 • AI技術を活用した新しい開発ツールの紹介 • コードの自動生成や補完機能を提供 • 開発者が入力したコメントや関数名に基づいて提案 • 多くのプログラミング言語に対応、特にJavaScriptやPythonが推奨 • コーディングの効率向上、エラー削減、開発時間短縮が期待される
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントやコードの一部を基に、AIが適切なコードを提案する機能があります。また、このツールは既存の開発環境に簡単に統合できるように設計されており、特にJavaScriptやTypeScriptのプロジェクトでの使用が推奨されています。これにより、開発の効率が向上し、エラーの削減が期待されます。 • AIを活用したコード自動生成ツールの紹介 • 開発者が入力したコメントに基づいてコードを提案 • JavaScriptやTypeScriptプロジェクトでの使用が推奨 • 既存の開発環境に簡単に統合可能 • 開発効率の向上とエラー削減が期待される

Upload your design inspiration to ChatGPT and find inspiration for similar items. Make shopping easier than ever with our visually immersive shopping experiences.

When GitLab co-founder Sid Sijbrandij was diagnosed with a rare and aggressive cancer, he approached it like an engineering problem. In this conversation, Sid joins geneticist Jacob Stern to share how they used ChatGPT, advanced diagnostics, and real-time research to better understand his tumor and explore personalized treatment options—building a faster feedback loop between patients, doctors, and scientific literature. About OpenAI Forum: The OpenAI Forum is a global community that brings together leaders across industries to share how AI is being used in the real world—what’s working, what we’re learning, and how we can shape its impact together. Learn more: https://forum.openai.com/

Today we're launching Cognition Japan, our first expansion into Asia, to partner with Japanese enterprises ready to transform how software gets built.
This post shows you how to manage FM transitions in Amazon Bedrock, so you can make sure your AI applications remain operational as models evolve. We discuss the three lifecycle states, how to plan migrations with the new extended access feature, and practical strategies to transition your applications to newer models without disruption.

Today, we're announcing AWS Agent Registry (preview) in AgentCore, a single place to discover, share, and reuse AI agents, tools, and agent skills across your enterprise.

“The really cool thing with Codex is that we get to iterate and ideate on feature requests with the customer in real time.” Ankur Goyal, founder & CEO of Braintrust dropped some builder knowledge in our latest episode of What Codex Unlocks. Learn more: https://openai.com/codex/ #Codex #openaicodex #shorts

This post walks you through three steps: starting a session and generating the Live View URL, rendering the stream in your React application, and wiring up an AI agent that drives the browser while your users watch. At the end, you will have a working sample application you can clone and run.

"The really cool thing with Codex, is that we get to iterate and ideate on feature requests with the customer in real time.” Ankur Goyal, founder & CEO of Braintrust dropped some builder knowledge in our latest episode of What Codex Unlocks. Learn more: https://openai.com/codex/
This year, we're doing it again. Interrupt 2026 is May 13–14 at The Midway in San Francisco, and the lineup, the format, and the scale have all leveled up.
この記事は、Hugging FaceのTransformersライブラリのバージョン5.5.3のパッチリリースについて説明しています。このリリースは、Gemma4のdevice_mapサポートを修正するための小規模なパッチです。具体的には、Cyrilvallezによるコミットが含まれており、device mapの自動設定に関する問題が解決されています。リリースは2023年4月9日に行われ、48のコミットがメインブランチに追加されています。 • Gemma4のdevice_mapサポートを修正するためのパッチリリース • Cyrilvallezによるコミットが含まれている • device mapの自動設定に関する問題が解決された • 2023年4月9日にリリースされた • メインブランチには48のコミットが追加された

Today we’re launching Deep Agents deploy in beta. Deep Agents deploy is the fastest way to deploy a model agnostic, open source agent harness in a production ready way. Deep Agents deploy is built for an open world. It’s built on Deep Agents - an open source, model

AI agents work best when they reflect the knowledge and judgment your team has built over time. Some of that is institutional knowledge that’s already documented and easy for an agent to use as-is. But most great organizations also rely on tacit knowledge that lives inside their employees’ minds.

In this post, you will learn how to build stateful MCP servers that request user input during execution, invoke LLM sampling for dynamic content generation, and stream progress updates for long-running tasks. You will see code examples for each capability and deploy a working stateful MCP server to Amazon Bedrock AgentCore Runtime.
この記事は、Hugging FaceのTransformersライブラリのバージョン5.5.2のパッチリリースについて説明しています。このリリースでは、Gemma4の最適化、use_cache=Falseの際の推論の修正、いくつかのモデルの重み名のシリアライズに関する変換マッピングの修正が行われました。具体的には、MoEをGemma4 TPプランに追加し、kv状態の共有をキャッシュから分離し、共有された重みを削除して読み込み時にスキップする処理が含まれています。これにより、モデルのパフォーマンスが向上し、より一貫した動作が実現されます。 • Gemma4の最適化が行われた • use_cache=Falseの際の推論の問題が修正された • いくつかのモデルの重み名のシリアライズに関する変換マッピングが修正された • MoEをGemma4 TPプランに追加した • kv状態の共有をキャッシュから分離した • 共有された重みを削除し、読み込み時にスキップする処理が追加された

ConvApparelは、LLM(大規模言語モデル)ベースのユーザーシミュレーターにおける「リアリズムギャップ」を定量化し、堅牢な会話エージェントのトレーニングを改善するために設計された新しい人間-AI会話データセットと評価フレームワークです。現代の会話AIエージェントは複雑なタスクを処理できますが、長時間の対話では制約を忘れたり、無関係な応答を生成したりすることが多いです。これを改善するためには、継続的なトレーニングとフィードバックが必要ですが、実際の人間テストに依存するのは高コストで時間がかかります。そこで、AI研究コミュニティはユーザーシミュレーターに注目していますが、現代のLLMベースのシミュレーターは依然としてリアリズムギャップに悩まされています。ConvApparelは、ユーザーシミュレーションの隠れた欠陥を明らかにし、信頼できるAIベースのテスターを構築するための道を提供します。データ収集プロトコルでは、参加者が「良い」エージェントまたは「悪い」エージェントにランダムにルーティングされ、人口統計統計、ヒューマンライクスコアリング、反事実検証を含む三本柱の検証戦略を用いています。これにより、単なる表面的な模倣を超えた人間行動の全範囲を捉えることができます。 • ConvApparelはLLMベースのユーザーシミュレーターのリアリズムギャップを定量化するための新しいデータセットと評価フレームワークを提供する。 • 現代の会話AIエージェントは長時間の対話で制約を忘れたり、無関係な応答を生成することが多い。 • ユーザーシミュレーターは、実際の人間テストに代わるスケーラブルな解決策として注目されている。 • ConvApparelは、良いエージェントと悪いエージェントの二重エージェントデータ収集プロトコルを使用している。 • 三本柱の検証戦略により、単なる表面的な模倣を超えた人間行動を捉えることができる。 • シミュレーターは新しい状況に対しても適切に反応する必要がある。 • 反事実検証の概念を導入し、シミュレーターが新しいエージェントにどのように適応するかを評価する。

Claude Managed Agents は Claude を自律的なエージェントとして動作させるためのハーネスとインフラストラクチャーを提供します。長時間かかるタスクや非同期のタスクを実行するために使用するのが想定されています。この記事では実際に Claude Managed Agents を試してみた内容を紹介します。
この記事は、Hugging FaceのTransformersライブラリのバージョン5.5.1のパッチリリースについて説明しています。このリリースは非常に小規模で、主にvLLMとGemma4に焦点を当てています。具体的には、Gemma4のエクスポートの修正と、vLLMのCISの修正が行われました。これらの修正は、開発者Arthur ZuckerとCyrilvallezによって行われ、統合テストも追加されています。 • v5.5.1は小規模なパッチリリースである • 主にvLLMとGemma4に関連する修正が含まれている • Gemma4のエクスポートの修正が行われた • vLLMのCISの修正が行われた • 統合テストが追加された
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や修正を行うことができます。具体的には、開発者が意図する機能を自然言語で入力すると、ツールがそれに基づいてコードを生成します。また、既存のコードに対しても改善提案を行う機能があります。これにより、開発の効率が向上し、エラーの削減が期待されます。さらに、ツールは多くのプログラミング言語に対応しており、幅広い開発環境で利用可能です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での入力に基づくコードの自動生成機能 • 既存コードへの改善提案機能 • 開発効率の向上とエラー削減の期待 • 多くのプログラミング言語に対応している
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や修正を行うことができます。具体的には、開発者が入力した要件に基づいて、AIが最適なコードを提案し、開発の効率を向上させることを目的としています。また、ツールの導入により、開発時間の短縮やエラーの減少が期待されると述べられています。さらに、実装方法や使用する際の注意点についても詳しく解説されています。 • AI技術を活用した新しい開発ツールの紹介 • 生成AIを利用したコードの自動生成や修正機能 • 開発者の要件に基づく最適なコード提案 • 開発効率の向上とエラーの減少が期待される • 実装方法や使用時の注意点についての解説

Mastra raises a $22M Series A led by Spark Capital, bringing total funding to $35M. Plus: the Mastra platform launches today.

Studio, Server, and Memory Gateway. Everything you need to run your agents at scale.
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いた機能が強化されています。具体的には、開発者が自然言語で指示を出すと、AIがそれに基づいてコードを生成することが可能です。また、ツールは既存の開発環境に簡単に統合できるよう設計されており、ユーザーは特別な設定を行うことなく利用を開始できます。これにより、開発の効率が大幅に向上し、エラーの削減にも寄与します。さらに、AIの学習能力により、使用するほどに精度が向上する点も特徴です。 • AI技術を活用した新しい開発ツールの紹介 • 自然言語での指示に基づいてコードを生成する機能 • 既存の開発環境への簡単な統合 • 開発効率の向上とエラー削減 • 使用するほどに精度が向上するAIの学習能力

Meta announced Muse Spark today, their first model release since Llama 4 almost exactly a year ago. It’s hosted, not open weights, and the API is currently “a private API …
RooCodeIncのRoo-Codeリポジトリで、バージョン3.52.0がリリースされました。このリリースは2021年4月8日に行われ、GitHub上で公開されています。リリースノートには、特定の変更点や新機能の詳細は記載されていませんが、リリースに関連するアセットが3つ用意されています。ユーザーは、GitHubのインターフェースを通じてこのリリースにアクセスし、必要に応じてダウンロードや比較を行うことができます。 • Roo-Codeのバージョン3.52.0がリリースされた • リリース日は2021年4月8日 • リリースに関連するアセットが3つ存在する • 具体的な変更点や新機能の詳細は記載されていない

この記事では、学術研究のワークフローを改善するために、2つのAIエージェントを紹介しています。PaperVizAgentは、学術的な図を描くためのビジュアライザーエージェントであり、ScholarPeerは、学術論文を自動的かつ厳密に評価するレビュアーエージェントです。研究者は、PaperVizAgentを使用して、研究の方法論や統計的プロットを含む出版準備が整った図を生成できます。ScholarPeerは、文献に基づいた批評を提供し、従来の自動レビュアーよりも優れた評価を行います。これらのエージェントは、研究者が革新に集中できるように設計されており、学術研究のライフサイクルを支援します。 • 学術研究のワークフローを改善するためのAIエージェントの導入 • PaperVizAgentは、学術的な図を自動生成するビジュアライザーエージェント • ScholarPeerは、論文を自動的に評価するレビュアーエージェント • PaperVizAgentは、研究の方法セクションと図のキャプションを基に図を生成 • ScholarPeerは、文献に基づいた批評を提供し、従来の自動レビュアーよりも優れた評価を行う • これらのエージェントは、研究者が革新に集中できるように設計されている

In this post, we'll walk you through a complete implementation of model fine-tuning in Amazon Bedrock using Amazon Nova models, demonstrating each step through an intent classifier example that achieves superior performance on a domain specific task. Throughout this guide, you'll learn to prepare high-quality training data that drives meaningful model improvements, configure hyperparameters to optimize learning without overfitting, and deploy your fine-tuned model for improved accuracy and reduced latency. We'll show you how to evaluate your results using training metrics and loss curves.

In healthcare and life sciences, AI agents help organizations process clinical data, submit regulatory filings, automate medical coding, and accelerate drug development and commercialization. However, the sensitive nature of healthcare data and regulatory requirements like Good Practice (GxP) compliance require human oversight at key decision points. This is where human-in-the-loop (HITL) constructs become essential. In this post, you will learn four practical approaches to implementing human-in-the-loop constructs using AWS services.

This post walks you through understanding audio embeddings, implementing Amazon Nova Multimodal Embeddings, and building a practical search system for your audio content. You'll learn how embeddings represent audio as vectors, explore the technical capabilities of Amazon Nova, and see hands-on code examples for indexing and querying your audio libraries. By the end, you'll have the knowledge to deploy production-ready audio search capabilities.

In this post, we explore where RFT is most effective, using the GSM8K mathematical reasoning dataset as a concrete example. We then walk through best practices for dataset preparation and reward function design, show how to monitor training progress using Amazon Bedrock metrics, and conclude with practical hyperparameter tuning guidelines informed by experiments across multiple models and use cases.

By Vivek Trivedy, Product Manager @ LangChain 💡TL;DR: We can build better agents by building better harnesses. But to autonomously build a “better” harness, we need a strong learning signal to “hill-climb” on. We share how we use evals as that signal, plus design decisions that help our agent generalize
この記事では、Mastraの新しいリリース(バージョン1.24.0)に関する重要な機能と変更点が紹介されています。主なハイライトとして、RAG(Retrieval-Augmented Generation)トレーシングのエンドツーエンドサポートが追加され、新しいスパンタイプ(RAG_INGESTION、RAG_EMBEDDINGなど)が導入されました。また、CloudExporterはトレースだけでなく、ログやメトリクスなどの全ての観測信号をバッチ処理してアップロードできるようになりました。さらに、スパンフィルタリング機能が追加され、観測プラットフォームのコストを削減するための選択的なスパンフィルタリングが可能になりました。AI SDK v6のメッセージサポートも強化され、メッセージの相互運用性が向上しました。これにより、エージェントの実行中にログの相関が修正され、より良い信頼性とデバッグ機能が提供されます。 • RAGトレーシングのエンドツーエンドサポートが追加された。 • 新しいスパンタイプ(RAG_INGESTION、RAG_EMBEDDINGなど)が導入された。 • CloudExporterが全ての観測信号をバッチ処理してアップロードできるようになった。 • スパンフィルタリング機能が追加され、観測プラットフォームのコストを削減できる。 • AI SDK v6のメッセージサポートが強化され、メッセージの相互運用性が向上した。
この記事では、画像や動画生成のための拡散モデルの効率的な実行を実現するために、MXFP8およびNVFP4というマイクロスケーリングフォーマットを使用した手法について説明しています。これらのフォーマットは、NVIDIAのBlackwellアーキテクチャにネイティブにサポートされており、メモリと計算リソースの要求を軽減します。具体的には、MXFP8は8ビットのフォーマットで、BF16よりも高速な推論を提供し、NVFP4は4ビットの浮動小数点フォーマットで、特に高バッチの計算負荷の高いワークロードに最適です。記事では、これらのフォーマットを使用した場合の推論速度の向上を示し、CUDAグラフやLPIPSを用いた精度とパフォーマンスの最適化についても触れています。 • MXFP8とNVFP4は、NVIDIAのBlackwellアーキテクチャに対応したマイクロスケーリングフォーマットである。 • MXFP8は8ビットフォーマットで、BF16よりも高速な推論を実現し、視覚品質の損失がほとんどない。 • NVFP4は4ビットフォーマットで、メモリフットプリントがBF16の約3.5倍小さく、高バッチの計算負荷に適している。 • CUDAグラフやLPIPSを用いて、モデルの精度とパフォーマンスを最適化する手法が紹介されている。 • 実験の再現に必要なコードが提供されている。

Find out how you can get more ROI from AI, manage AI costs effectively, and turn AI adoption into lasting business value.
I have a feeling that everyone likes using AI tools to try doing someone else’s profession. They’re much less keen when someone else uses it for their profession.
この記事は、GitHub上でのlangchain-testsのバージョン1.1.6のリリースに関する情報を提供しています。このリリースでは、sandboxバックエンド用の標準テストが更新され、依存関係のバージョンがいくつか引き上げられています。具体的には、pygmentsが2.20.0以上に更新され、requestsが2.32.5から2.33.0に、orjsonが3.11.5から3.11.6にバンプされています。また、CI環境でのpytestのストリーミング出力が抑制され、不要な依存関係のインストールを避けるための変更も行われています。これにより、テストのパフォーマンスが向上し、全体的なコードの品質が改善されることが期待されます。 • バージョン1.1.6ではsandboxバックエンド用の標準テストが更新された。 • 依存関係としてpygmentsが2.20.0以上に、requestsが2.32.5から2.33.0に、orjsonが3.11.5から3.11.6にバンプされた。 • CI環境でのpytestのストリーミング出力が抑制された。 • 不要な依存関係のインストールを避けるための変更が行われた。 • テストのパフォーマンス向上とコード品質の改善が期待される。

A Blog post by IBM Research on Hugging Face
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自動補完機能やエラーチェック機能が強化されています。また、ユーザーインターフェースが直感的で使いやすく、初心者でも簡単に扱えるように設計されています。さらに、既存の開発環境との互換性が高く、導入が容易であることも特徴です。これにより、開発の効率が向上し、エラーの発生を減少させることが期待されています。 • AI技術を活用した新しい開発ツールの紹介 • 自動補完機能やエラーチェック機能が強化されている • 直感的で使いやすいユーザーインターフェース • 初心者でも簡単に扱える設計 • 既存の開発環境との高い互換性 • 導入が容易で開発効率が向上することが期待される
この記事は、Chromaのバージョン1.5.7のリリースに関する情報を提供しています。このリリースでは、CLIワークフローのためのRustセットアップの更新、全クライアントSDKおよびサーバーにおけるgetCollectionById APIの追加、クエリにおけるshard_index、num_shards、log_upper_bound_offsetの引き渡し、ルーティングの変更とヘルパーの追加、ログの上限を設定するための機能の追加、ストリーミングS3アップロード用のput_streamの追加、ログのパーティショニングのヘルパーの追加、セグメントライターとフラッシャーの抽象化、シャード結果のマージ、CLIのシグナルハンドラーの修正などが含まれています。これにより、Chromaの機能が向上し、より効率的なデータ処理が可能になります。 • Chromaのバージョン1.5.7がリリースされた。 • CLIワークフローのためのRustセットアップが更新された。 • 全クライアントSDKおよびサーバーにgetCollectionById APIが追加された。 • クエリにおいてshard_index、num_shards、log_upper_bound_offsetが引き渡されるようになった。 • ログの上限を設定する機能が追加された。 • ストリーミングS3アップロード用のput_streamが追加された。 • ログのパーティショニングのためのヘルパーが追加された。 • CLIのシグナルハンドラーが修正された。
Monarchは、PyTorch用の分散プログラミングフレームワークで、巨大なクラスター上での分散トレーニングジョブを簡単に実行できるように設計されています。これにより、スーパコンピュータを直接制御可能なシステムとして扱うことができ、ローカル開発の体験を大規模トレーニングに持ち込むことができます。Monarchは、エージェントが開発タスクを効率的に実行できるように、RDMAを利用したリモートファイルシステムや分散SQLテレメトリを提供します。また、KubernetesやSLURMとの統合が可能で、リソースを一度プロビジョニングすれば、必要なだけのジョブを実行できます。Monarchは、エージェント駆動のトレーニング開発を強化し、デバッグや依存関係の同期を迅速に行えるようにします。 • Monarchは分散トレーニングジョブを簡単に実行できるフレームワークである。 • スーパコンピュータを直接制御可能なシステムとして扱うことができる。 • RDMAを利用したリモートファイルシステムにより、コードや依存関係を迅速に同期できる。 • 分散SQLテレメトリを使用して、ライブ状態情報を収集し、デバッグを容易にする。 • KubernetesやSLURMとの統合が可能で、リソースを一度プロビジョニングすれば、複数のジョブを実行できる。
この記事では、深層学習における正規化手法であるLayerNormとRMSNormのtorch.compileによるパフォーマンス向上について評価しています。NVIDIA H100およびB200でのカーネルごとの性能を向上させ、ほぼ最先端のパフォーマンスを達成することを目指しています。LayerNormは平均と分散を用いて入力を正規化し、RMSNormは平方和を用いて正規化します。Quackというライブラリを基準にtorch.compileの性能を評価し、torch.compileがQuackの約50%の性能であることを確認しました。最終的に、オートチューニングを行い、Inductorのデフォルトを改善することで、H100およびB200での最先端性能を達成しました。 • LayerNormとRMSNormは深層学習における重要な正規化手法である。 • torch.compileの性能をNVIDIA H100およびB200で評価し、最先端のパフォーマンスを目指した。 • Quackライブラリを基準にtorch.compileの性能を比較した結果、torch.compileはQuackの約50%の性能であった。 • オートチューニングを行い、Inductorのデフォルト設定を改善することで、性能を向上させた。 • 特に、内側の削減RBLOCKをスケールアップし、持続的な削減のXBLOCKを調整した。

Discover OpenAI’s Child Safety Blueprint—a roadmap for building AI responsibly with safeguards, age-appropriate design, and collaboration to protect and empower young people online.
この記事は、GitHub上でのchroma-coreプロジェクトのCLIバージョン1.4.3のリリースに関する情報を提供しています。このリリースは2023年4月8日に行われ、GitHubの署名付きコミットとして記録されています。リリースには6つのアセットが含まれており、ユーザーはこれらをダウンロードして利用することができます。記事内では、リリースに関する具体的な問題や課題、提案される解決策、実装方法についての詳細は記載されていません。 • CLIバージョン1.4.3が2023年4月8日にリリースされた。 • リリースはGitHubの署名付きコミットとして記録されている。 • リリースには6つのアセットが含まれている。 • 具体的な問題や課題、解決策、実装方法についての詳細は記載されていない。
この記事は、langgraph-cliのバージョン0.4.21のリリースに関する情報を提供しています。このリリースでは、前のバージョン0.4.20からの変更点として、新たにvalidateコマンドが追加されました。リリースはGitHub上で行われ、コミットはGitHubの検証済み署名で作成されています。記事には、リリース日やバージョン番号、変更内容が記載されていますが、具体的な使用方法や他の機能についての詳細は含まれていません。 • langgraph-cliのバージョン0.4.21がリリースされた • 新たにvalidateコマンドが追加された • リリースはGitHubで行われた • コミットはGitHubの検証済み署名で作成された • 前のバージョンは0.4.20である
この記事は、langgraph-cliのバージョン0.4.20のリリースに関する情報を提供しています。このリリースでは、いくつかの依存関係の更新や機能追加が行われました。特に、langgraphのデプロイに対するリモートビルドサポートが追加され、デプロイメント名を.envファイルに保存する機能が修正されました。また、いくつかのライブラリのバージョンが更新され、全体的な依存関係の管理が改善されています。これにより、開発者はより安定した環境で作業できるようになります。 • langgraph-cliのバージョン0.4.20がリリースされた • リモートビルドサポートが追加された • デプロイメント名を.envファイルに保存する機能が修正された • 複数の依存関係が更新され、安定性が向上した • 開発者がより良い環境で作業できるようになる
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Edit agent instructions, tools, and display conditions from Studio with draft/publish versioning, or programmatically through the editor API.

With Amazon Bedrock Projects, you can attribute inference costs to specific workloads and analyze them in AWS Cost Explorer and AWS Data Exports. In this post, you will learn how to set up Projects end-to-end, from designing a tagging strategy to analyzing costs.

Chinese AI lab Z.ai's latest model is a giant 754B parameter 1.51TB (on Hugging Face) MIT-licensed monster - the same size as their previous GLM-5 release, and sharing the same …

Anthropic didn’t release their latest model, Claude Mythos (system card PDF), today. They have instead made it available to a very restricted set of preview partners under their newly announced …

AI is advancing faster than most people realize. In this OpenAI Forum conversation, Sam Altman joins Josh Achiam and Adrien Ecoffet to talk about what’s coming next. They discuss the pace of progress toward more capable AI systems, what these tools could unlock—from scientific breakthroughs to new ways of building companies—and the challenges society needs to prepare for. The conversation also looks at who gets access to AI, how to make sure the benefits are widely shared, and what it will take for institutions and individuals to keep up.
この記事は、langgraph-sdkのバージョン0.3.13のリリースに関する情報を提供しています。このリリースでは、いくつかの重要な変更が行われました。具体的には、再接続URLの検証機能が追加され、runs.create/stream/waitメソッドにlangsmith_tracingパラメータが追加されました。また、langgraphのバージョン1.1.6やprebuiltのバージョン1.0.9もリリースされています。依存関係の更新も行われており、pygments、langchain-core、starlette、requestsのバージョンがそれぞれ更新されています。 • langgraph-sdkのバージョン0.3.13がリリースされた • 再接続URLの検証機能が追加された • runs.create/stream/waitメソッドにlangsmith_tracingパラメータが追加された • langgraphのバージョン1.1.6がリリースされた • 依存関係としてpygments、langchain-core、starlette、requestsのバージョンが更新された

We're releasing SWE-1.6, our latest model optimized for both intelligence and model UX.

Microsoft has released an open source toolkit for enforcing runtime security policies on AI agents as adoption accelerates faster than governance cont...

Project Glasswing is a new initiative that brings together Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, and Palo Alto Networks in an effort to secure the world’s most critical software. We formed Project Glasswing because of capabilities we’ve observed in a new frontier model trained by Anthropic that we believe could reshape cybersecurity. Claude Mythos Preview is a general-purpose, unreleased frontier model that reveals a stark fact: AI models have reached a level of coding capability where they can surpass all but the most skilled humans at finding and exploiting software vulnerabilities. Read more: https://anthropic.com/glasswing

TL;DR: We’ve released new minor versions of deepagents & deepagentsjs, featuring async (non-blocking) subagents, expanded multi-modal filesystem support, and more. See the changelog for details. Async subagents Deep Agents can now delegate work to remote agents that run in the background. As opposed to the existing inline subagents, which

This post walks through building an automated podcast generator that creates engaging conversations between two AI hosts on any topic, demonstrating the streaming capabilities of Nova Sonic, stage-aware content filtering, and real-time audio generation.

In this post, we show you how to build a natural text-to-SQL solution using Amazon Bedrock that transforms business questions into database queries and returns actionable answers.

Arcade is the MCP runtime for production agents, delivering secure agent authorization, reliable tools, and governance. This integration gives your agents access to Arcade’s collection of 7,500+ agent-optimized tools through a single secure gateway.

This article was written by Andrew Green, technical writer and industry analyst. We pay Andrew, but he refuses to write anything else but his own opinion. The big boys entered the market, OpenClaw appropriated the MCP security strategy, and everyone started vibe coding but only if they already knew how
Apollo Skills cut AI agent token usage and completion time down significantly — same result, far less cost. Here's what the experiment revealed.
この記事では、TorchInductorに新たに統合されたCuteDSLバックエンドについて説明しています。TorchInductorは、行列乗算のためにTriton、CUTLASS(C++)、cuBLASの3つの自動調整バックエンドをサポートしており、CuteDSLはその4番目のバックエンドとして追加されました。CuteDSLは、NVIDIAが開発を進めており、最適化されたカーネルテンプレートを提供することで、TorchInductorのメンテナンス負担を軽減します。さらに、CuteDSLはPythonで書かれており、コンパイル時間が短く、CUTLASS C++よりも維持管理が容易です。GEMM(行列の積)操作は、トランスフォーマーモデルの計算プロファイルの大部分を占めており、これらの操作の最適化が重要です。CuteDSLは、最新のNVIDIAハードウェアでの最適なGEMMパフォーマンスを提供するために適したバックエンドとされています。 • TorchInductorにCuteDSLを新たに統合したこと • CuteDSLはNVIDIAが開発しており、最適化されたカーネルテンプレートを提供 • メンテナンス負担が軽減され、コンパイル時間が短縮される • CuteDSLはPythonで書かれており、CUTLASS C++よりも維持管理が容易 • GEMM操作はトランスフォーマーモデルの計算プロファイルの大部分を占める • CuteDSLは最新のNVIDIAハードウェアでの最適なGEMMパフォーマンスを提供するために適している

この記事では、AIスキルの管理と共有について考察されています。スキルはAIが自動的に起動し、プロンプトに従って動作する機能であり、特にチームでの開発においてスキルの共有が重要です。スキルは「知識系」と「ワークフロー系」に分類され、知識系スキルは共有に適し、ワークフロー系スキルは個人ごとにカスタマイズが求められます。スキルのモジュラー化が理想とされますが、AIの指示追随能力の限界から、実際にはうまく機能しないことが多いと述べられています。最終的には、知識系スキルを全社で共有し、ワークフロー系スキルを個人で管理する運用が現実的であると結論づけています。 • AIスキルは自然言語で条件を示すことで自動的に起動する機能である。 • スキルの共有はチーム開発において重要であり、リポジトリや社内マーケットプレイスを通じて行われる。 • スキルには「知識系」と「ワークフロー系」の2種類があり、知識系は共有に適し、ワークフロー系は個人のカスタマイズが求められる。 • 知識系スキルの例として、チケット管理システムの操作方法が挙げられる。 • ワークフロー系スキルの例として、PRを作成する手順があり、個人の要望に応じてカスタマイズされる。 • スキルのモジュラー化が理想だが、AIの指示追随能力の限界から実現が難しい。 • スキル名を明示することで、AIが必要なスキルを呼び出す確率が上がる。 • 全社的な知識は知識系スキルとして共有し、個人のワークフローはワークフロー系スキルとして管理する運用が望ましい。
この記事は、Chromaのバージョン1.5.6のリリースノートを提供しています。このリリースでは、いくつかのドキュメントの改善や新しい機能が追加され、特にクエリやレスポンスの具体例が追加されました。また、S3クライアントの設定改善や、ガーベジコレクタのパニックに関するバグ修正が行われています。さらに、MCMRに関連する機能強化や、JSクライアントの警告を削除する改善も含まれています。全体として、パフォーマンスの向上やエラー処理の改善が図られています。 • Chromaのバージョン1.5.6がリリースされた。 • クエリやレスポンスの具体例が追加された。 • S3クライアントの設定改善が行われた。 • ガーベジコレクタのパニックに関するバグが修正された。 • MCMRに関連する機能強化が行われた。 • JSクライアントの警告を削除する改善が含まれている。 • 全体的なパフォーマンスの向上が図られている。
この記事は、langchain-ollamaのバージョン1.1.0のリリースに関するもので、主に新機能や修正点について説明しています。新機能としては、response_formatのサポート、OllamaEmbeddingsへの次元追加、logprobsのサポートが含まれています。また、いくつかのバグ修正も行われており、特に呼び出し元リストの変更を防ぐ修正や、クライアントが初期化されていない場合のエラーを発生させる修正が含まれています。さらに、依存関係の更新やCIの改善も行われています。 • 新機能としてresponse_formatのサポートが追加された • OllamaEmbeddingsに次元が追加された • logprobsのサポートが追加された • 呼び出し元リストの変更を防ぐバグ修正が行われた • クライアントが初期化されていない場合のエラーを発生させる修正が行われた • 依存関係の更新が行われた • CIの改善が行われた

Monitor AI agents with dashboards for aggregate health and traces to debug individual runs, using OpenTelemetry gen_ai spans, with real code examples.

In this post, we walk through building a custom HR onboarding agent with Quick. We show how to configure an agent that understands your organization’s processes, connects to your HR systems, and automates common tasks, such as answering new-hire questions and tracking document completion.

In this post, we walk through how we fine-tuned Qwen 2.5 7B Instruct for tool calling using RLVR. We cover dataset preparation across three distinct agent behaviors, reward function design with tiered scoring, training configuration and results interpretation, evaluation on held-out data with unseen tools, and deployment.

In this post, we show how to implement a generative AI agentic assistant that uses both semantic and text-based search using Amazon Bedrock, Amazon Bedrock AgentCore, Strands Agents and Amazon OpenSearch.

This blog post demonstrates how Windward helps enhance and accelerate alert investigation processes by combining geospatial intelligence with generative AI, enabling analysts to focus on decision-making rather than data collection.

OpenAI and LG Uplus engineers collaborated to create a next-generation AICC, “Agentic AICC,” which is positioned to become a new standard for enterprise AI customer service. LG Uplus plans to introduce an agent service featuring ultra-low-latency AI customer support built on the OpenAI Realtime API, along with a Planning Agent that can resolve issues on its own using checklist-based workflows. #LGUplus #OpenAI #AICC #AIContactCenter #AgenticAICC #LLM #AgenticCallBot

Amazon Bedrock AgentCore Gateway provides a centralized layer for managing how AI agents connect to tools and MCP servers across your organization. In this post, we walk through how to configure AgentCore Gateway to connect to an OAuth-protected MCP server using the Authorization Code flow.

Build a production-ready RAG system architecture. Understand core components, how to implement, challenges, and best practices.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIがリアルタイムでサポートを提供し、効率的なコーディングを実現します。具体的には、AIがコードの提案やエラーチェックを行い、開発者の生産性を向上させることを目的としています。また、ツールの導入方法や設定手順についても詳しく解説されており、特に初心者にとっても使いやすい設計がされています。さらに、AIの学習データとして多様なプログラミング言語が使用されており、幅広い開発環境に対応可能です。 • AI技術を活用した新しい開発ツールの紹介 • リアルタイムでのコード提案やエラーチェック機能 • 開発者の生産性向上を目的とした設計 • 初心者にも使いやすい導入方法と設定手順 • 多様なプログラミング言語に対応した学習データの使用
Terrible name, really great app: this is Google's official app for running their Gemma 4 models (the E2B and E4B sizes, plus some members of the Gemma 3 family) directly …
Scan for secrets in files you plan to share
Cleanup Claude Code Paste
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に自然言語処理を用いたコード生成機能が特徴です。具体的には、開発者が自然言語で指示を出すと、それに基づいてコードを自動生成することが可能です。また、ツールは既存のコードベースとの互換性があり、簡単に導入できる点も強調されています。さらに、AIによるコードレビュー機能も搭載されており、品質向上に寄与することが期待されています。 • AIを活用したコード生成ツールの紹介 • 自然言語での指示に基づくコード自動生成機能 • 既存のコードベースとの互換性がある • 簡単に導入できる設計 • AIによるコードレビュー機能の搭載
Lalit Maganti provides one of my favorite pieces of long-form writing on agentic engineering I've seen in ages. They spent eight years thinking about and then three months building syntaqlite, …
From anonymized U.S. ChatGPT data, we are seeing: ~2M weekly messages on health insurance ~600K weekly messages [classified as healthcare] from people living in “hospital deserts” (30 min drive to …

Most discussions of continual learning in AI focus on one thing: updating model weights. But for AI agents, learning can happen at three distinct layers: the model, the harness, and the context. Understanding the difference changes how you think about building systems that improve over time. The three main layers

The Top AI Papers of the Week (March 30 - April 5)
Scan for secrets in files you plan to share
Scan for secrets in files you plan to share
Scan for secrets in files you plan to share

コーディングエージェントの自動承認の範囲をどこまで許可するかは、ユーザー体験とセキュリティのバランスを取る上で重要な設計指針の1つです。Codex ではサンドボックス機能を提供することで、エージェントが安全に自律的に動作できる環境を実現しています。この記事では、Codex のサンドボックスの仕組みと、サンドボックス外でコマンドを実行する際の承認プロセスについて説明します。
Research into the HTTP APIs from various LLM providers.
この記事は、GitHub上でのchroma-coreプロジェクトのCLIバージョン1.4.2のリリースに関する情報を提供しています。リリースは2023年4月4日に行われ、GitHubの署名付きコミットとして記録されています。リリースには6つのアセットが含まれており、ユーザーはこれらをダウンロードして利用することができます。記事内では、リリースに関する具体的な問題や課題、提案される解決策、実装方法についての詳細は記載されていません。 • CLIバージョン1.4.2が2023年4月4日にリリースされた • リリースはGitHubの署名付きコミットとして記録されている • リリースには6つのアセットが含まれている • 具体的な問題や課題、解決策、実装方法についての詳細は記載されていない

Cursor 3, Gemma 4, Qwen3.6-Plus, GLM-5V-Turbo, Claude Code Source Leak, Emotion Concepts in LLMs, and More
3月31日の朝、Xのタイムラインが騒がしくなっていました。Claude Codeのソースコードが流出したというのです。調べてみると、npmパッケージ(v2.1.88)にデバッグ用のsource mapファイル(cli.js.map)が含まれた状態でリリースされていました。source mapのsourcesContentフィールドに元のTypeScriptソースコード全体がそのまま埋め込まれており、発見者の投稿は数千万ビューを記録。GitHubにミラーリングされ数万フォークされる事態になりました。 Claude code source code has been leaked via a map file in their npm registry! Code: https://t.co/jBiMoOzt8G pic.twitter.com/rYo5hbvEj8 — Chaofan Shou (@Fried_rice) March 31, 2026
Thomas Ptacek's take on the sudden and enormous impact the latest frontier models are having on the field of vulnerability research. Within the next few months, coding agents will drastically …

A fun thing about recording a podcast with a professional like Lenny Rachitsky is that his team know how to slice the resulting video up into TikTok-sized short form vertical …
On the kernel security list we've seen a huge bump of reports. We were between 2 and 3 per week maybe two years ago, then reached probably 10 a week …
The challenge with AI in open source security has transitioned from an AI slop tsunami into more of a ... plain security report tsunami. Less slop but lots of reports. …
Months ago, we were getting what we called 'AI slop,' AI-generated security reports that were obviously wrong or low quality. It was kind of funny. It didn't really worry us. …
この記事は、GitHub上で公開されているlanggraphのバージョン1.1.6のリリースに関する情報を提供しています。このリリースは2023年4月3日に行われ、主な変更点として、実行情報のパッチ修正が含まれています。リリースノートには、前のバージョン1.1.5からの変更点が記載されており、GitHubの署名付きコミットによって作成されたことが確認されています。 • langgraphのバージョン1.1.6が2023年4月3日にリリースされた • 主な変更点は実行情報のパッチ修正である • リリースはGitHub上で公開されている • 前のバージョン1.1.5からの変更点が含まれている • GitHubの署名付きコミットによって作成された
この記事は、Langchainのバージョン1.2.15のリリースに関する情報を提供しています。このリリースでは、aiohttpライブラリがバージョン3.13.3から3.13.4にアップデートされました。リリースはGitHub上で行われ、コミットはGitHubの検証済み署名で作成されています。リリース日付は2023年4月3日で、特に新機能の追加や大きな変更は記載されていません。 • Langchainのバージョン1.2.15がリリースされた • aiohttpライブラリがバージョン3.13.3から3.13.4にアップデートされた • リリースはGitHubで行われた • コミットはGitHubの検証済み署名で作成された • 新機能の追加や大きな変更はない
この記事は、GitHub上で公開されているlanggraphのバージョン1.1.5のリリースに関する情報を提供しています。このリリースでは、主に実行時の情報を強化する機能が追加され、リモートビルドのサポートも含まれています。また、いくつかのURLの修正やREADMEの更新も行われています。これにより、langgraphの使用がより便利になり、開発者がより多くの情報を得られるようになります。 • langgraphのバージョン1.1.5がリリースされた • 実行時の情報を強化する機能が追加された • リモートビルドのサポートが追加された • いくつかのURLが修正された • READMEが更新された
この記事は、GitHub上でのlanggraph-prebuiltのバージョン1.0.9のリリースに関する情報を提供しています。このリリースでは、ランタイムの強化やツールノードの注入バグの修正が行われました。また、依存関係の更新も含まれており、特にpygments、langchain-core、requestsのバージョンがそれぞれ2.20.0、1.2.22、2.33.0にアップデートされています。これにより、全体的なパフォーマンスと安定性が向上することが期待されます。 • ランタイムの強化により、より多くの実行情報が提供される • ツールノードの注入バグが修正された • 依存関係としてpygments、langchain-core、requestsがそれぞれアップデートされた • 全体的なパフォーマンスと安定性の向上が期待される
The Axios team have published a full postmortem on the supply chain attack which resulted in a malware dependency going out in a release the other day, and it involved …

本記事では、LLM(大規模言語モデル)の行動傾向の評価と整合性についての体系的な評価フレームワークを紹介しています。このフレームワークは、モデルの行動傾向を人間の社会的傾向と比較し、モデルの出力と人間の合意との間の整合性や逸脱を定量化することを目的としています。具体的には、共感や自己主張などの特性を評価するための標準化された心理学的質問票を用いて、LLMの行動傾向を評価します。研究では、プロフェッショナルな落ち着きや対立解決、日常的な意思決定など、現実的なユーザーアシスタントシナリオにおけるLLMの行動を分析しました。25のLLMを対象にした大規模な分析の結果、モデルの傾向が人間の合意から逸脱している場合や、合意がない場合に人間の意見の範囲を捉えられていない場合があることが明らかになりました。今後の研究では、これらの結果を基に、モデルの行動の整合性を向上させる機会が期待されています。 • LLMの行動傾向を評価するための体系的なフレームワークを導入 • モデルの出力と人間の合意との整合性を定量化 • 心理学的質問票を用いてLLMの行動傾向を評価 • 現実的なユーザーアシスタントシナリオでのモデルの行動を分析 • 25のLLMを対象にした大規模な分析で2種類のギャップを特定 • モデルの行動が人間の合意から逸脱する場合がある • 今後の研究でモデルの行動の整合性を向上させる機会が期待される
この記事は、GitHub上でのlangchain-coreのバージョン1.2.25のリリースに関する情報を提供しています。このリリースでは、主に2つの修正が行われました。1つ目は、廃止されたプロンプト読み込み機能におけるテキストファイルのチェックを強化する修正です。2つ目は、ドキュメント内の誤字を修正するもので、これによりユーザーがより正確な情報を得られるようになっています。これらの変更は、ユーザーの利便性を向上させることを目的としています。 • 廃止されたプロンプト読み込み機能におけるテキストファイルのチェックを強化した • ドキュメント内の誤字を修正した • ユーザーの利便性を向上させることを目的としている

I was a guest on Lenny Rachitsky’s podcast, in a new episode titled An AI state of the union: We’ve passed the inflection point, dark factories are coming, and automation …

Four new vision-capable Apache 2.0 licensed reasoning LLMs from Google DeepMind, sized at 2B, 4B, 31B, plus a 26B-A4B Mixture-of-Experts. Google emphasize "unprecedented level of intelligence-per-parameter", providing yet more evidence …
LLM plugin to access Google's Gemini family of models

💡TL;DR: Open models like GLM-5 and MiniMax M2.7 now match closed frontier models on core agent tasks — file operations, tool use, and instruction following — at a fraction of the cost and latency. Here's what our evals show and how to start using them in Deep Agents. Over the

In this post, we explore how ActorSimulator in Strands Evaluations SDK addresses the challenge with structured user simulation that integrates into your evaluation pipeline.

Anthropic leaked Claude Code via source maps. A Bun bug, missing .npmignore, and weak release checks exposed 500k+ lines of code.
この記事は、Hugging FaceのTransformersライブラリのバージョン5.5.0のリリースに関するもので、新しいモデルの追加について詳述しています。新たに追加されたGemma4は、マルチモーダルモデルで、事前学習済みおよび指示調整済みのバリエーションがあり、1B、13B、27Bのパラメータを持っています。Gemma4は、異なるサイズの画像を固定トークン数で処理する新しい設計を採用しており、画像の自然なアスペクト比を保持します。また、NomicBERTは、8192のコンテキスト長を持つBERTインスパイアのエンコーダモデルで、短いコンテキストと長いコンテキストのベンチマークでOpenAIのモデルを上回る性能を示しています。さらに、Music Flamingoは、音楽に関する理解と推論を強化するために設計されたオーディオ・言語モデルです。 • Gemma4はマルチモーダルモデルで、異なるサイズの画像を固定トークン数で処理する新設計を採用している。 • NomicBERTは8192のコンテキスト長を持ち、短いコンテキストと長いコンテキストのベンチマークで優れた性能を示す。 • Music Flamingoは音楽に特化したオーディオ・言語モデルで、音声、音、音楽を統一的に処理する。 • Gemma4は、画像の自然なアスペクト比を保持しつつ、トークン数の制約を設けている。 • NomicBERTは、特定の指示プレフィックスを使用して、検索、クラスタリング、分類のための密なベクトル埋め込みを生成する。

AI models sometimes act like they have emotions—why? We studied one of our recent models and found that it draws on emotion concepts learned from text to inhabit its role as Claude, the AI assistant. These representations influence its behavior the way emotions might influence a human. And that has real consequences, affecting how Claude answers chats, writes code, and makes decisions. Read more about this research: https://www.anthropic.com/research/emotion-concepts-function

Gemma 4: our most intelligent open models to date, purpose-built for advanced reasoning and agentic workflows.

Google is introducing two new inference tiers to the Gemini API, Flex and Priority, to balance cost and latency.

This post describes how TGS achieved near-linear scaling for distributed training and expanded context windows for their Vision Transformer-based SFM using Amazon SageMaker HyperPod. This joint solution cut training time from 6 months to just 5 days while enabling analysis of seismic volumes larger than previously possible.

In this post, we show you how to configure AWS Network Firewall to restrict AgentCore resources to an allowlist of approved internet domains. This post focuses on domain-level filtering using SNI inspection — the first layer of a defense-in-depth approach.

Through a strategic partnership with the AWS Generative AI Innovation Center (GenAIIC), Rocket Close developed an intelligent document processing solution that has significantly reduced processing time, making the process 15 times faster. The solution, which uses Amazon Textract for OCR processing and Amazon Bedrock for foundation models (FMs), achieves a strong 90% overall accuracy in document segmentation, classification, and field extraction.

In this post, we go through how to use managed session storage to persist your agent's filesystem state and how to execute shell commands directly in your agent's environment.

Using AI for every workflow step isn't just unnecessary — it's slower, costlier, and less reliable when rule-based logic fits. This post covers practical patterns for combining deterministic and AI steps in n8n, with downloadable templates and hands-on exercises for each.

A foundation for anyone new to n8n, covering the platform concepts you'll see throughout the Production AI Playbook series.
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコードの意図を理解し、適切なコードスニペットを提案する機能があります。また、ユーザーインターフェースは直感的で使いやすく、開発者が迅速に作業を進められるように設計されています。さらに、このツールは既存の開発環境に簡単に統合できるため、導入のハードルが低い点も強調されています。 • AI技術を活用した新しい開発ツールの紹介 • コードの自動生成や補完機能を提供 • 開発者の意図を理解し、適切なコードスニペットを提案 • 直感的で使いやすいユーザーインターフェース • 既存の開発環境に簡単に統合可能
この記事では、最新のAI技術を活用した新しい開発ツールについて説明しています。このツールは、開発者がコードを書く際にAIの支援を受けることができるもので、特に生成AIを利用してコードの自動生成や補完を行います。具体的には、開発者が入力したコメントや関数名に基づいて、AIが適切なコードを提案する機能があります。また、ツールは多くのプログラミング言語に対応しており、特にJavaScriptやPythonでの使用が推奨されています。これにより、開発者はコーディングの効率を大幅に向上させることができ、エラーの削減や開発時間の短縮が期待されます。 • AIを活用したコード自動生成ツールの紹介 • 開発者が入力した内容に基づいてコードを提案する機能 • JavaScriptやPythonなど多くの言語に対応 • コーディング効率の向上が期待される • エラー削減や開発時間短縮のメリット
I just sent the March edition of my sponsors-only monthly newsletter. If you are a sponsor (or if you start a sponsorship now) you can access it here. In this …
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
LLM integration plugin for other plugins to depend on
Enrich data by prompting LLMs
It feels like spring has sprung here, and so has a new NVIDIA integration, ticket sales for Interrupt 2026, and announcing LangSmith Fleet (formerly Agent Builder).

Gradient Labs is giving every bank customer an AI account manager, with CSAT up to 98% and over 50% resolution on day one. In banking support, even simple issues like a declined payment can trigger multiple teams, handoffs, and delays. Gradient Labs replaces that with a single agent that handles the full workflow. Identity checks, card actions, and follow-ups happen in one continuous conversation. Read their full story here: https://lnkd.in/emSndtkx

"Codex code review is industry gold standard." We checked in with Ramp to hear how the AI Dev X team is leveraging Codex to build an AI-driven on-call helper to take the burden off engineers. " Codex with GPT 5.4 is adept at dealing with complexity in a way that would have required a lot mental effort...but Codex handles it like its nothing" Learn more: https://openai.com/codex/
この記事は、Langchainのコアライブラリのバージョン1.2.24のリリースに関する情報を提供しています。このリリースでは、OpenAIファイル入力用のプレースホルダーファイル名を補完する機能が追加され、また、全パッケージに対してPygmentsのバージョンを2.20.0以上に更新する作業が行われました。さらに、_WellKnownOpenAIToolsに「computer」を追加する修正も含まれています。これらの変更は、Langchainの機能性とセキュリティを向上させることを目的としています。 • OpenAIファイル入力用のプレースホルダーファイル名を補完する機能の追加 • 全パッケージに対してPygmentsのバージョンを2.20.0以上に更新 • _WellKnownOpenAIToolsに「computer」を追加する修正 • セキュリティ向上のための更新が含まれている

This post demonstrates how to build an automated competitive price intelligence system that streamlines manual workflows, supporting teams to make data-driven pricing decisions with real-time market insights.

A Blog post by H company on Hugging Face

A practical look at governing AI agents with clarity, speed, and platform‑level enforcement across the enterprise.

Discover what's new in The Replay, LogRocket's newsletter for dev and engineering leaders, in the April 1st issue.

Google partnered with the Brazilian government on a satellite imagery map to help protect the country’s forests.

Here are Google’s latest AI updates from March 2026
A Blog post by Technology Innovation Institute on Hugging Face
Import unstructured data (text and images) into structured tables