Kisah Pelanggan/Perangkat Lunak dan Internet/Amerika Serikat

2024
Logo Perplexity

Perplexity mempercepat pelatihan Model Fondasi sebesar 40% dengan Amazon SageMaker HyperPod

Pelajari bagaimana perusahaan rintisan AI generatif Perplexity melakukan pelatihan model dengan lebih cepat dan lebih efisien menggunakan Amazon SageMaker HyperPod.

Hingga 40% pengurangan

waktu pelatihan

100.000+ kueri per jam

yang didukung

Mempertahankan

latensi rendah 

Mengoptimalkan

pengalaman pengguna

Gambaran Umum

Sebagai kekuatan transformatif, kecerdasan buatan (AI) generatif mencakup algoritma machine learning (ML) yang mampu menghasilkan konten baru, dari gambar hingga teks, dengan belajar dari data dengan jumlah yang sangat besar. Perplexity, sebuah perusahaan yang saat ini sedang membangun salah satu mesin jawaban percakapan pertama di dunia, menggunakan kekuatan AI generatif untuk membantu pengguna menemukan pengetahuan yang relevan.

Menghadapi tantangan untuk mengoptimalkan modelnya agar akurat dan presisi, Perplexity membutuhkan solusi kuat yang mampu menangani persyaratan komputasinya. Dengan visi untuk meningkatkan pengalaman pengguna, Perplexity telah beralih ke Amazon Web Services (AWS). Menggunakan infrastruktur ML, pustaka pelatihan, dan alat inferensi yang canggih dari AWS, Perplexity memperoleh fleksibilitas, performa, dan efisiensi yang diperlukan untuk melayani basis pengguna global dalam skala besar.

Peluang | Menggunakan Layanan AWS untuk Mengoptimalkan Pengalaman Pengguna

Tidak seperti mesin pencari tradisional yang sering meningkatkan iklan dan kata kunci tertentu daripada hasil yang relevan, solusi Perplexity dioptimalkan untuk menghubungkan pengguna dengan pengetahuan yang mereka cari. Sekitar 10 juta pengguna aktif bulanan mengandalkan Perplexity untuk mempelajari konsep baru, memecahkan tantangan, dan menemukan jawaban.

“Menggunakan model bahasa besar, kami dapat menggabungkan pemahaman bahasa manusia dan kemampuan penalaran menjadi satu model. Langkah ini, dikombinasikan dengan fakta di internet, telah membantu kami membangun mesin jawaban kami,” kata Aravind Srinivas, CEO dan salah satu pendiri Perplexity. “Pada dasarnya, kami menggabungkan indeks pencarian tradisional (mesin fakta) dan mesin penalaran (model bahasa besar) menjadi satu untuk membangun mesin jawaban percakapan pertama di dunia.”

Sejak diluncurkan pada tahun 2022, Perplexity telah menggunakan layanan AWS inti seperti Amazon Elastic Compute Cloud (Amazon EC2)—yang menyediakan kapasitas komputasi yang aman dan dapat diubah ukurannya untuk hampir semua beban kerja—untuk mendukung komponen backend, front end, dan pencarian produknya. Seiring makin matangnya Perplexity dan jumlah model ML-nya yang bertambah, perusahaan tersebut membutuhkan kekuatan komputasi yang besar untuk melayani pengguna.

Perplexity berbicara dengan pakar AWS dan mengetahui bahwa Amazon SageMaker HyperPod, infrastruktur yang dibangun khusus untuk pelatihan terdistribusi dalam skala besar, dapat memenuhi kebutuhannya untuk pelatihan model skala besar. Amazon SageMaker HyperPod telah dikonfigurasi sebelumnya dengan pustaka pelatihan terdistribusi Amazon SageMaker yang dioptimalkan untuk menjalankan data kustom paralel yang sangat skalabel dan hemat biaya serta memodelkan pekerjaan pelatihan deep learning paralel dengan kecepatan interkoneksi yang melebihi 1.600 Gbps. Amazon SageMaker HyperPod juga mencegah gangguan pada pelatihan model fondasi dengan menyimpan pos pemeriksaan secara berkala. Jika kegagalan perangkat keras terjadi selama pelatihan, layanan AWS akan otomatis mendeteksi kegagalan, memperbaiki atau mengganti instans yang rusak, dan melanjutkan pelatihan dari pos pemeriksaan terakhir yang disimpan. Langkah ini memfasilitasi pelatihan model tanpa gangguan selama berminggu-minggu atau berbulan-bulan dalam lingkungan terdistribusi.

kr_quotemark

Di AWS, kekuatan ada di tangan pelanggan. Tidak ada persyaratan mengenai layanan mana yang perlu Anda gunakan.”

Aravind Srinivas
CEO dan Cofounder, Perplexity

Solusi | Mengurangi Waktu Pelatihan Model hingga 40% dengan Amazon SageMaker HyperPod

AWS menawarkan Perplexity uji coba satu bulan untuk menunjukkan kemampuan pelatihan terdistribusi, dan selama itu perusahaan menemukan keuntungan menggunakan AWS. Misalnya, Perplexity memperoleh fleksibilitas yang lebih besar dalam alokasi sumber daya dengan menggunakan berbagai jenis instans Amazon EC2 dan GPU yang disesuaikan untuk tugas tertentu.

Untuk melatih model ML, Perplexity membutuhkan memori dalam jumlah besar sehingga dapat menjalankan data dalam jumlah yang sangat besar dan menyimpan gradien yang berbeda. Perplexity memilih Instans P4de Amazon EC2—yang memberikan performa tertinggi untuk pelatihan ML dan aplikasi komputasi performa tinggi—untuk menjalankan tugas pelatihan agar dapat memenuhi persyaratan memori dan bandwidth. Menggunakan Amazon SageMaker HyperPod, Perplexity mentransfer data di antara GPU yang berbeda dengan jauh lebih cepat sehingga mengurangi waktu pelatihan model ML hingga 40 persen.

“Data bawaan dan pustaka paralel model dari Amazon SageMaker HyperPod membantu kami mengoptimalkan waktu pelatihan pada GPU serta menggandakan throughput pelatihan.” ungkap Srinivas. Hasilnya, eksperimen pelatihan kami sekarang dapat berjalan dua kali lebih cepat, yang berarti developer kami dapat melakukan iterasi lebih cepat sehingga pengembangan pengalaman AI generatif baru untuk pelanggan kami juga makin cepat. Karena Amazon SageMaker HyperPod memantau kondisi klaster dan memperbaiki kegagalan GPU secara otomatis, developer kami dapat berfokus pada pembuatan model daripada menghabiskan waktu untuk mengelola serta mengoptimalkan infrastruktur dasar.”

Perplexity bertujuan memberikan tanggapan cepat dan akurat terhadap kueri pengguna yang membutuhkan kemampuan inferensi mendekati waktu nyata. Menggunakan Instans P5 Amazon EC2—yang memberikan instans berbasis GPU performa unggulan untuk aplikasi deep learning—Perplexity dapat menghasilkan jawaban dengan throughput yang jauh lebih tinggi dibandingkan sebelumnya.. Bahkan, perusahaan dapat menangani periode lonjakan dengan 10.000 pengguna bersamaan dan lebih dari 100.000 kueri per jam tanpa mengorbankan latensi atau memengaruhi pengalaman pengguna. Perplexity juga melakukan hosting model Llama 2 yang tersedia untuk umum di Instans Amazon EC2 P5 dan menggunakan Amazon SageMaker HyperPod untuk menyempurnakan model sumber terbuka menggunakan datanya sendiri. Model penyempurnaan membantu meningkatkan akurasi dan relevansi respons sehingga dapat menyesuaikan model dengan kebutuhan mesin jawaban Perplexity.

Hasil | Memajukan AI Generatif Menggunakan Infrastruktur AWS dan Layanan AI/ML

Berbekal dari keberhasilan yang dicapai, Perplexity siap untuk membuka jalan baru dalam AI generatif. Sebagai bagian dari strategi yang berorientasi ke masa depan, perusahaan akan bereksperimen dengan AWS Trainium, akselerator pelatihan ML performa tinggi, untuk lebih meningkatkan throughput pelatihan. Perplexity juga meluncurkan API untuk memberi pengguna akses ke model bahasa besarnya yang berjalan seluruhnya di AWS dan telah dioptimalkan oleh Amazon SageMaker HyperPod.

Untuk memperluas basis pengetahuannya dan memberikan jawaban yang lebih akurat bagi penggunanya, Perplexity juga telah mengadopsi Amazon Bedrock, layanan yang dikelola sepenuhnya dan menawarkan pilihan model fondasi performa tinggi dari perusahaan AI terkemuka dengan satu API. Misalnya, Perplexity telah mulai menggunakan Claude 2 melalui Amazon Bedrock untuk memasukkan kemampuan canggih untuk pengodean, matematika, dan penalaran ke dalam layanannya.

“Di AWS, kekuatan ada di tangan pelanggan,” kata Srinivas. “Tidak ada persyaratan mengenai layanan mana yang perlu Anda gunakan. Tim AWS selalu memberi tahu kami, 'Lakukan yang terbaik untuk pelanggan Anda. Lakukan yang terbaik untuk bisnis Anda.” Keselarasan pelanggan itulah yang sangat kami sukai dari AWS.”

Tentang Perplexity

Perplexity membangun mesin jawaban fungsional dan percakapan yang dioptimalkan untuk membantu pengguna menemukan pengetahuan, bukan sekadar meningkatkan iklan dan kata kunci.

Layanan AWS yang Digunakan

Amazon SageMaker HyperPod

AmazonSageMaker HyperPod menghilangkan beban berat yang tidak terdiferensiasi yang diperlukan dalam membangun dan mengoptimalkan infrastruktur machine learning (ML) untuk melatih model fondasi (FM), sehingga mengurangi waktu pelatihan hingga 40%.

Pelajari lebih lanjut »

Instans P5 Amazon EC2

Instans P5 Amazon Elastic Compute Cloud (Amazon EC2) ditenagai oleh GPU NVIDIA H100 Tensor Core terbaru, yang memberikan performa tertinggi di Amazon EC2 untuk aplikasi deep learning (DL) dan komputasi performa tinggi (HPC).

Pelajari lebih lanjut »

Instans P4de Amazon EC2

Instans P4de didukung oleh 8 GPU NVIDIA A100 dengan memori GPU HBM2e performa tinggi 80GB, 2X lebih tinggi dari GPU di instans P4d kami saat ini.

Pelajari lebih lanjut »

Amazon Bedrock

Amazon Bedrock adalah layanan terkelola penuh yang menawarkan pilihan model fondasi (FM) performa tinggi dari perusahaan AI terkemuka, seperti AI21 Labs, Anthropic, Cohere, Meta, Stability AI, dan Amazon melalui API tunggal, bersama dengan serangkaian kemampuan yang luas yang Anda butuhkan untuk membangun aplikasi AI generatif dengan keamanan, privasi, dan AI yang bertanggung jawab.

Pelajari lebih lanjut »

Kisah Pelanggan Perangkat Lunak dan Internet Lainnya

tidak ada item yang ditemukan 

1

Mulai

Organisasi dalam berbagai ukuran di semua industri mentransformasi bisnis mereka dan mewujudkan misi mereka setiap hari menggunakan AWS. Hubungi ahli kami dan mulai perjalanan AWS Anda sendiri sekarang juga.