Aurora PostgreSQL での pgvector 0.7.0 サポートを発表

投稿日: 2024年8月8日

Amazon Aurora PostgreSQL 互換エディションは、データベースにベクトル埋め込みを保存するための PostgreSQL のオープンソース拡張である pgvector 0.7.0 をサポートするようになりました。pgvector にはベクトル類似性検索機能があり、これにより、生成 AI アプリケーションにおけるセマンティック検索と検索拡張生成 (RAG) に Aurora を使用することが可能です。

pgvector 0.7.0 では、Aurora での Hierarchical Navigable Small Worlds (HNSW) インデックスのビルド時間を改善するために並列処理が追加されます。pgvector 0.7.0 では、2 バイトの浮動小数点数として次元を格納するための halfvec と、最大 1,000 の非ゼロ次元を格納するための sparsevec という 2 つの新しいベクトルデータ型が追加され、PostgreSQL ネイティブのビットタイプを使用したバイナリベクトルのインデックス作成がサポートされるようになりました。これらが追加されることで、PostgreSQL 式インデックスを使用して、ベクトルデータ型に対してスカラーおよびバイナリ量子化を使用できるようになります。これにより、インデックスのストレージサイズが小さくなり、インデックスの構築時間が短くなります。量子化により、インデックス化できるベクトルの最大次元を増やすこともできます。ハーフベックの場合は 4,000、バイナリベクトルの場合は 64,000 です。

pgvector 0.7.0 は、中国リージョンを除くすべての該当する AWS リージョン (AWS GovCloud (米国) リージョンを含む) で、PostgreSQL 16.3、15.7、14.12、13.15、および 12.19 以降を実行している Amazon Aurora クラスターで使用できます。マイナーバージョンのアップグレードを開始するには、DB クラスターに変更を加えます。詳細については、Aurora のドキュメントを参照してください。

Amazon Aurora は MySQL および PostgreSQL との完全な互換性を備えており、圧倒的な高いパフォーマンスおよび可用性を世界規模で実現するように設計されています。このサービスは、組み込みのセキュリティ、継続的なバックアップ、サーバーレスコンピューティング、最大 15 のリードレプリカ、自動化されたマルチリージョンレプリケーション、AWS の他のサービスとの統合を提供します。Amazon Aurora の使用を開始するには、開始方法のページをご覧ください。