انتشار Nemotron 3 از NVIDIA: یک تحول در هوش مصنوعی با معماری Mamba

توسط  30 آذر1404  بدون نظر
مقدمه شرکت NVIDIA به تازگی از محصول جدید خود، خانواده مدل‌های Nemotron 3 رونمایی کرده است. این مدل‌ها بخشی از یک سیستم کامل برای هوش مصنوعی ابرازی هستند و به طرز شگفت‌انگیزی کارایی و قابلیت‌های جدیدی را برای استدلال‌های طولانی و کنترل دقیق بر هزینه‌های استنتاج ارائه می‌دهند. در این…

معرفی ابزارهای جدید OpenAI برای مدل‌های وزن‌ساز و اتصال آن‌ها به مدل‌های متراکم

توسط  23 آذر1404  بدون نظر
معرفی ابزار جدید OpenAI: مدل‌های وزن‌ساز OpenAI به تازگی بسته‌های جدیدی را تحت عنوان ‘circuit-sparsity’ معرفی کرده است. این ابزارها به منظور اتصال مدل‌های وزن‌ساز به مدل‌های متراکم از طریق پل‌های فعالیت طراحی شده‌اند. این نوآوری نه تنها حوزه هوش مصنوعی را تحت تأثیر قرار می‌دهد، بلکه روش‌ها و استانداردهای…

معرفی Jina-VLM: مدل زبان دیداری چندزبانه از Jina AI

توسط  18 آذر1404  بدون نظر
مقدمه‌ای بر Jina-VLM اخیراً شرکت Jina AI مدل زبان دیداری جدیدی به نام Jina-VLM را معرفی کرده است. این مدل با ۲.۴ میلیارد پارامتر هدفش ارائه پاسخ‌های بصری چندزبانه و تسهیل درک مستندات بر روی سخت‌افزارهایی با منابع محدود است. با توجه به رشد سریع تکنولوژی‌های هوش مصنوعی، این مدل…

NVIDIA و Mistral AI: افزایش سرعت استنتاج 10 برابر برای خانواده Mistral 3

توسط  12 آذر1404  بدون نظر
مقدمه در دنیای امروز، همکاری‌های بین‌شرکتی به نحوی پیشرفته‌تر از همیشه به تحولات جدیدی در زمینه فناوری اطلاعات و هوش مصنوعی منجر شده است. یکی از این همکاری‌ها، اتحاد NVIDIA و Mistral AI است که به‌تازگی اعلام شده و پیشرفت‌های قابل توجهی در سرعت استنتاج برای مدل‌های جدید هوش مصنوعی…

معرفی Step-Audio-R1: انقلاب در هوش مصنوعی صوتی

توسط  09 آذر1404  بدون نظر
معرفی Step-Audio-R1 در دنیای رو به پیشرفت هوش مصنوعی، یکی از چالش‌های بزرگ، پردازش و تولید صوت به شکلی است که همزمان با افزایش طول ورودی، کیفیت نتایج نیز حفظ شود. در این راستا، تیم تحقیقاتی StepFun با افتخار از مدل جدید خود به نام Step-Audio-R1 رونمایی کرده است. این…