جامعه هوش مصنوعی دیروز پس از افشای عملکرد مخفیانه و آسیب‌زننده مدل «کلود فِیبل ۵» غوغا به پا کرد. آنتروپیک (Anthropic) تنها یک روز بعد، مجبور به عذرخواهی و تغییر موضع شد. این شرکت قول داده که مکانیزم‌های نظارتی را از حالت نامرئی خارج و آن‌ها را آشکار کند تا کاربران بدانند چه زمانی خروجی مدل سانسور یا تغییر می‌یابد.

اما این پیروزی جامعه کاربران، یک نکتۀ منفی بزرگ هم دارد. آنتروپیک هشدار داده که با آشکارسازی این سانسورها، احتمالاً شاهد افزایش موارد «هشدار اشتباه» یا False Positive خواهیم بود. به عبارت دیگر، ممکن است مدل محتوای بی‌ضرر را نیز بیش‌ازحد محافظه‌کارانه علامت‌گذاری و محدود کند که خود می‌تواند برای توسعه‌دهندگان و کاربران آزاردهنده باشد.

نظر کارشناسی:

این حرکت نشان می‌دهد فشار جامعه متن‌باز و توسعه‌دهندگان حتی بر بزرگ‌ترین بازیگران هوش مصنوعی هم تأثیرگذار است. با این حال، افزایش هشدارهای اشتباه می‌تواند اعتماد به ابزارهای آنتروپیک را در کوتاه‌مدت کاهش دهد و فضایی برای رقبای شفاف‌تر ایجاد کند. در بلندمدت، این رویداد استاندارد جدیدی برای شفافیت در صنعت هوش مصنوعی تعریف می‌کند و پروژه‌هایی که شفافیت را اولویت قرار دهند، موقعیت گاوی (صعودی) بهتری خواهند داشت.

منبع: Decrypt (مشاهده متن اصلی)