Generative AI | Amazon Web Services ブログ

AWS Amplify によるフルスタック開発の進化

高速でパーソナライズされた体験を提供するために、Web アプリケーションの構築とレンダリング方法は、長年にわたって大きく進化してきました。その過程で、Web アプリケーションを構築する開発者の役割も、この進化を反映して変化してきました。本記事では、フルスタックの Web 開発の進化過程と、急速に変化する Web アプリケーションエコシステムやユーザーのニーズに対し、開発者が AWS Amplify を使って適応する方法について説明します。

Amazon Bedrock にカスタムモデルをインポートする (プレビュー)

Amazon Bedrock では、主要な人工知能 (AI) 企業が提供する高性能な基盤モデル (FM) を利 […]

生成AIで外観検査をやってみた

1. はじめに製造業における品質管理は非常に重要な課題です。製品の外観や組立状態を確認し、欠陥の有無を判断す […]

AWS Trainium を活用した日本語大規模言語モデルの分散学習と AWS Inferentia2 上での推論環境構築

生成 AI の進化を支える大規模言語モデルの開発及び運用に掛かるコスト、計算機リソースの確保は多くの企業が抱える大きな課題です。AWS では機械学習 (ML) アクセラレーターチップ AWS Trainium、AWS Inferentia2 を自社開発し、これらの課題解決に取り組んでいます。（Anthropic では AWS Trainium、Inferentia の活用を表明しています）
本ブログでは、前半で、AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスを活用した日本語大規模言語モデルの開発事例、大規模分散学習の課題及び実現方法について解説します。
ブログ後半では、公開された日本語大規模モデルを Inferentia2 搭載 Amazon EC2 Inf2 インスタンス上で推論実行する方法について、手順を追って解説します。

生成 AI を使用して従業員の生産性向上を支援する Amazon Q Business の一般提供開始

AWS re:Invent 2023 では、Amazon Q Business のプレビューを行いました。Am […]

デベロッパーエクスペリエンスを再構想する新たな機能が搭載された Amazon Q Developer の一般提供開始

Amazon Web Services (AWS) が2023年プレビューとして Amazon Q Deve […]

新しい安全フィルターとプライバシーコントロールを備えた Amazon Bedrock のガードレールが利用可能になりました

4月23日、re: Invent 2023でプレビュー版として初めてリリースされた Amazon Bedroc […]

Amazon Titan イメージジェネレータとウォーターマーク検出 API が Amazon Bedrock で利用できるようになりました

AWS re:Invent 2023 では、 Amazon Titan イメージジェネレータのプレビューを発 […]

Amazon Bedrock で利用可能になった Cohere Command R および R+ でスケーラブルなエンタープライズグレードの生成 AI ワークロードを実行

2023 年 11 月、Amazon Bedrock で 2 つの新しい Cohere モデル (Cohere […]

Amazon Kendra と Amazon Bedrock で構成した RAG システムに対する Advanced RAG 手法の精度寄与検証

Advanced RAG の枠組みでは、検索前処理 (pre-retrieval) と検索後処理 (post-retrieval) としてさまざまな工夫が考案されています。検索前処理では、インデックス構造の最適化やクエリの改善を行います。検索後処理では、検索結果のランク付けや情報の圧縮を行い、大規模言語モデル (LLM) への入力を最適化します。これにより、よりコンパクトで的確な追加情報を LLM に提供し、応答品質の向上を図ります。本記事では Advanced RAG に分類される手法のうち、特に LLM を用いたクエリ拡張 (query expansion) と、検索結果の関連度評価という手法による回答品質への影響を簡易的に評価した結果を紹介します。

Category: Generative AI