مدل جدید شرکت چینی Zhipu AI با تکیه بر استفاده گسترده از ابزار Tailwind CSS موفق به شکست رقیب قدرتمند آمریکایی خود شد.
در رویدادی غافلگیرکننده برای دنیای هوش مصنوعی، جدیدترین مدل شرکت چینی Zhipu AI یعنی GLM-۵.۲، موفق شد با کنار زدن Claude Fable 5 رتبه نخست یکی از معتبرترین بنچمارکهای کدنویسی خلاقانه را از آن خود کند.
اخیراً پلتفرم Design Arena در شبکه اجتماعی ایکس اعلام کرده که مدل GLM-۵.۲ جایگاه اول را در جدول امتیازات طراحی وب تکمرحلهای HTML (در دسته بدون ایجنت) تصاحب کرده است. این پلتفرم اعلام کرد که مدل چینی توانسته مدل Claude Fable 5 و همچنین نسخههای Opus 4.6 و 4.7 از آنتروپیک را شکست دهد. این موفقیت نشاندهنده جهش صعودی ۵ پلهای نسبت به نسخه قبلی یعنی GLM-۵.۱ است و امتیاز این مدل را در بخش کدنویسی به حدود ۱۳۶۰ رسانده است.

عملکرد خیرهکننده مدل هوش مصنوعی GLM-۵.۲
چیزی که این پیروزی را متمایز میکند، نحوه طراحی این مدل است. این مدل هوش مصنوعی در ایجاد چیدمانهای تمیز، فراخوانی تصاویر از شبکههای توزیع محتوا (CDN)، تایپوگرافی، سلسلهمراتب بصری و استفاده از انیمیشنهای ظریفی که باعث پویایی سایت میشوند، عملکرد فوقالعادهای دارد. علاوهبراین، هماهنگی بسیار بالایی با کتابخانههای محبوبی مانند Chart.js و Three.js دارد.
یک نکته جالب توجه اینکه مدل GLM-۵.۲ اتکای زیادی به چارچوب Tailwind CSS دارد و در ۹۱ درصد از طراحیهای خود از آن استفاده کرده است؛ همچنین در ۵۱ درصد موارد از Font Awesome بهره برده است. در مقایسه، مدل Fable 5 تنها در ۵۷ درصد مواقع از Tailwind استفاده کرده که این موضوع میتواند تا حدودی فاصلههای کاربردی مشاهدهشده توسط کاربران را توصیف کند.
در کنار کیفیت طراحی، قیمتگذاری این مدل نیز بسیار نویدبخش است. هزینه استفاده از API مدل GLM-۵.۲ در حدود ۱.۴۰ دلار به ازای هر میلیون توکن ورودی و ۴.۴۰ دلار برای هر میلیون توکن خروجی است که به مراتب مقرونبهصرفهتر از قیمت ۱۰ دلار ورودی و ۵۰ دلار خروجی مدل Fable 5 است. علاوهبراین، GLM-۵.۲ یک مدل متنباز با وزنهای در دسترس تحت مجوز MIT است که از پنجره ۱ میلیون توکنی بهره میبرد؛ این ویژگی به تیمهای توسعهدهنده اجازه میدهد تا مدل را بهصورت محلی اجرا کنند و پروژههای بزرگتر و طولانیتر را بدون وابستگی به سرویسهای انحصاری پیش ببرند.

رویکرد پلتفرم Design Arena به این نتایج اعتبار زیادی میدهد؛ چرا که میلیونها رأی از سوی طراحان واقعی و با تمرکز بر زیباییشناسی و کاربردپذیری واقعی ثبت شده است و نتایج آن متکی بر آزمونهای مصنوعی نیست. این دستاورد نهتنها یک پیروزی در زمینه طراحی وب است، بلکه مدل GLM-۵.۲ را در میان قویترین مدلهای متنباز در بنچمارکهای گستردهتر کدنویسی نیز قرار میدهد. برای جامعه هوش مصنوعی، این موفقیت نشانه دیگری از حرکت سریع آزمایشگاههای چینی در حوزههای خلاقانه تخصصی است و با توجه به ترکیب عملکرد قوی، هزینه پایین و متنباز بودن، میتواند این مدل را به انتخاب اول بسیاری از تیمهای توسعه وب تبدیل کند.
