براساس جدیدترین گزارشها، مدل زبانی بزرگ بعدی دیپسیک بین تاریخ ۱۵ تا ۳۰ آگوست (بین ۲۴ مرداد تا ۸ شهریور) و با نام DeepSeek-R2 از راه خواهد رسید.انتظار میرود با استفاده از نسخهی پیشرفتهتر سیستم Mixture of Experts، جهش قابلتوجهی در معماری و عملکرد هوش مصنوعی دیپسیک صورت بگیرد. گفته میشود DeepSeek-R2 حدود ۱٫۲ تریلیون پارامتر خواهد داشت، یعنی تقریباً دو برابر DeepSeek-R1 با ۶۷۱ میلیارد پارامتر.در راستای کاهش وابستگی چین به آمریکا، مدل DeepSeek-R2 کاملاً با تراشههای Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهرهوری ۸۲ درصدی، معادل ۹۱ درصد از کارایی تراشهی A100 انویدیا را ارائه میدهد.مقالههای مرتبطهوش مصنوعی دیپ سیک چیست؟ آموزش استفاده از DeepSeekهوش مصنوعی بعدی دیپسیک ۹۷ درصد کمهزینهتر از GPT-4 خواهد بودگفته میشود بهدلیل استفاده از سختافزار داخلی و تکینکهای بهینهسازی، هزینهی آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از مدل GPT-4 است. انتشار مدل جدید دیپسیک میتواند بهشدت مدلهای فعلی OpenAI و Anthropic را تحت تأثیر قرار بدهد.خبرهای پیرامون DeepSeek-R2 باعث رشد ۲۰ درصدی سهام شرکت Cambricon شدهاند و ارزش بازار این شرکت اکنون به حدود ۴۹٫۷ میلیارد دلار رسیده است. شرکت نامبرده در حوزهی توسعهی پردازندههای هوش مصنوعی فعالیت میکند.
ظاهراً هزینهی آموزش جدیدترین مدل هوش مصنوعی دیپسیک، ۹۷ درصد کمتر از مدل GPT-4 است.
ارسال نظرات