Last updated: 2026/02/25 03:00
この記事は、langgraph-sdkのバージョン0.3.9のリリースに関する情報を提供しています。このリリースでは、threads.search()メソッドにextractパラメータが追加され、機能が拡張されました。また、型チェックのためのmake typeターゲットが追加されるなど、開発者向けの改善も行われています。これにより、SDKの使い勝手が向上し、より効率的な開発が可能になります。 • langgraph-sdkのバージョン0.3.9がリリースされた • threads.search()メソッドにextractパラメータが追加された • 型チェックのためのmake typeターゲットが追加された • SDKの機能が拡張され、開発者向けの改善が行われた • これにより、SDKの使い勝手が向上した

In this post, we show you how to build a comprehensive photo search system using the AWS Cloud Development Kit (AWS CDK) that integrates Amazon Rekognition for face and object detection, Amazon Neptune for relationship mapping, and Amazon Bedrock for AI-powered captioning.

Watch the full episode: https://www.youtube.com/watch?v=9jgcT0Fqt7U

Watch the full episode: https://www.youtube.com/watch?v=9jgcT0Fqt7U

Watch the full episode: https://www.youtube.com/watch?v=9jgcT0Fqt7U
Helionは、開発者が高性能なMLカーネルを記述できる高水準DSLであり、最適化の複雑なタスクを自動調整エンジンに委ねています。この自動調整エンジンは、実装選択の広大な高次元空間を探索し、ターゲットハードウェア上でのパフォーマンスを最大化する構成を発見します。しかし、自動調整には長い時間がかかるという欠点があり、ユーザーからの不満の一因となっています。新たに開発されたLFBOパターン検索アルゴリズムは、機械学習の技術を用いて自動調整エンジンの効率を改善し、候補構成の評価数を大幅に削減します。このアルゴリズムにより、NVIDIA B200カーネルでは自動調整時間を36.5%短縮し、カーネルのレイテンシを平均2.6%改善しました。AMD MI350カーネルでも同様の改善が見られ、特定のカーネルでは最大50%の時間短縮が達成されています。 • Helionは高性能MLカーネルを記述するためのDSLで、最適化を自動調整エンジンに委ねる。 • 自動調整エンジンは高次元の実装選択空間を探索し、パフォーマンスを最大化する構成を見つける。 • 自動調整には長い時間がかかり、ユーザーからの不満が多い。 • LFBOパターン検索アルゴリズムは機械学習を用いて自動調整の効率を改善し、評価する候補構成の数を減少させる。 • NVIDIA B200カーネルで自動調整時間を36.5%短縮し、レイテンシを2.6%改善。 • AMD MI350カーネルでも自動調整時間を25.9%短縮し、レイテンシを1.7%改善。 • 特定のカーネルでは最大50%の時間短縮が達成されている。

Builders Unscripted spotlights the stories behind real projects and the mindset that makes them possible: you can just build things. Prior to joining OpenAI, Peter Steinberger sat down with Romain Huet, Head of Developer Experience, to talk about OpenClaw, his journey in open source, and how he builds with Codex.
この記事は、mastraの新しいリリース(バージョン1.6.0)に関するもので、主に新機能や改善点について説明しています。新たに追加されたASTベースのワークスペース編集ツールは、識別子の名前変更、インポートの追加・削除・マージ、メタ変数を用いたパターンベースの置換を可能にし、@ast-grep/napiがインストールされているプロジェクトで自動的に利用可能です。また、ツールレンダラーはリアルタイムで引数のプレビューをストリーミングし、タスクの追跡を構造化するための新しいビルトインツールも追加されました。さらに、観察メモリの継続性が改善され、メッセージウィンドウが縮小しても会話の連続性が保たれるようになりました。 • 新しいASTベースのワークスペース編集ツールが追加され、コードのインテリジェントな変換が可能に • 識別子の名前変更、インポートの追加・削除・マージ、メタ変数を用いたパターンベースの置換をサポート • ツールレンダラーがリアルタイムで引数のプレビューをストリーミングする機能を追加 • タスクの追跡を構造化するためのビルトインツールが追加された • 観察メモリの継続性が改善され、会話の連続性が向上

In this post, we demonstrate how to train CodeFu-7B, a specialized 7-billion parameter model for competitive programming, using Group Relative Policy Optimization (GRPO) with veRL, a flexible and efficient training library for large language models (LLMs) that enables straightforward extension of diverse RL algorithms and seamless integration with existing LLM infrastructure, within a distributed Ray cluster managed by SageMaker training jobs. We walk through the complete implementation, covering data preparation, distributed training setup, and comprehensive observability, showcasing how this unified approach delivers both computational scale and developer experience for sophisticated RL training workloads.

This post explores the implementation of Dottxt’s Outlines framework as a practical approach to implementing structured outputs using AWS Marketplace in Amazon SageMaker.

In this post, we are exciting to announce availability of Global CRIS for customers in Thailand, Malaysia, Singapore, Indonesia, and Taiwan and give a walkthrough of technical implementation steps, and cover quota management best practices to maximize the value of your AI Inference deployments. We also provide guidance on best practices for production deployments.

We’re excited to announce the availability of Anthropic’s Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5, Claude Sonnet 4.5, and Claude Haiku 4.5 through Amazon Bedrock global cross-Region inference for customers operating in the Middle East. In this post, we guide you through the capabilities of each Anthropic Claude model variant, the key advantages of global cross-Region inference including improved resilience, real-world use cases you can implement, and a code example to help you start building generative AI applications immediately.