אנתרופיק הוציאה את קלוד 4 - לא דגם אחד, אלא מבחר שלם. יש את אופוס (הדגם הכבד), סונט (הדגם החדש כברירת מחדל) והייקו (הדגם הקל והמהיר).
זו לא השקה הייפ. זו השקה מבנית.
הם פורסים כלים, זיכרון, שכבות בטיחות וכיוון ברור: בינה מלאכותית שמופיעה, נשארת בסביבה, ובאמת עוזרת.
מה שהחברה אומרת
אנתרופיק אומר שקלוד 4 בנוי להתמודד עם יותר - יותר משימות, יותר שלבים, יותר מורכבות - עם יותר שליטה.
זה יכול להתמודד עם תהליכים ארוכים יותר
קלוד אופוס נבחן על משימות קידוד שרצו במשך שבע שעות רצופות.זה פועל תחת אמצעי בטיחות מחמירים יותר
Opus 4 פועל בתקן ASL-3: התקן הפנימי של Anthropic המכסה עמידות לפריצות פריצה, אבטחת סייבר וניטור סיכונים.זה נועד לעבודה אמיתית
עם כלים, זיכרון וממשקי API - זה בנוי לשימוש מעשי, לא למשחק.
המנכ"ל דריו אמודי תיאר את יציאתה של סונט כ"קפיצות משמעותיות".
מה זה אומר (במילים אנושיות)
קלוד 4 לא מנסה להיות חבר הצ'אטבוט שלכם. הוא מוגדר להתמודד עם יותר - לא רק תשובות חכמות, אלא עבודה אמיתית.
הנה איך זה נראה:
הוא משתמש בכלים - הוא יכול לקחת קבצים, לחפש דברים ולקרוא לפונקציות כדי לבצע משימות בפועל
זה מכיל יותר הקשר - לא רק תשובות חד פעמיות, אלא שרשראות ארוכות של נימוקים
זה עוקב אחר דברים - כמו הטון שלך, המטרות שלך והדברים שאתה עובד עליהם
זה נשאר יציב - כך שלא תצטרכו להתחיל מחדש כשמשהו נהיה מורכב
עדכון זה עוסק פחות במה שקלוד אומר ויותר במה שקלוד אמור לעשות כעת.
בואו נחבר את הנקודות
בואו נתמקד במה שחשוב באמת בגרסה החדשה הזו - הדברים שהופכים את קלוד 4 לשימושי יותר ואמין יותר בעבודה היומיומית.
🧠 זה יכול להכיל הקשר (מבלי להפוך את זה למוזר)
קלוד 4 תומך כעת ב:
עד 200,000 טוקנים של קלט (כ-500 עמודים)
אופוס מפיק עד 32,000 טוקנים; סונט יכולה להגיע ל-64,000
זיכרון שעוקב אחר שמך, העדפותיך, טון הכתיבה ומשימות קודמות
כרטיסיית זיכרון גלויה שבה ניתן לצפות, לערוך או למחוק אותה
זה לא עניין של בינה מלאכותית שתהפוך לאישית. זה עניין של להיות שימושית מבחינה מעשית. העברת הקשר בשקט מבלי לבקש ממך לחזור על עצמך.
קלוד 4 לעומת צ'אטGPT: השוואה בין זיכרון להקשר
תכונה | קלוד 4 (אופוס וסונטה) | צ'אט GPT (GPT-4-turbo) |
חלון ההקשר | עד 200,000 אסימונים | עד 128,000 אסימונים |
אורך פלט | אופוס: 32,000 אסימונים סונטה: 64,000 | עד 4,096 אסימונים |
זמינות זיכרון | מופעל כברירת מחדל ב-Opus & Sonnet | מופעל ב-GPT-4 בלבד (בתשלום) |
מה זה עוקב אחריו | שם, צליל, העדפות, קבצים/משימות קודמים | שם, העדפות, מטרות ידועות |
בקרות זיכרון | כרטיסיית זיכרון מלאה לעריכה/מחיקה בכל עת | נמצא בהגדרות החשבון (פחות גלוי) |
גישה חינמית לתוכנית | כן (סונטה) | אין זיכרון ברמה החינמית (3.5 בלבד) |
מיקום | ממוסגר כתמיכה לכלי | ממוסגר כנוחות המשתמש |
🔒 מגיע עם גבולות מובנים - כשאנחנו אומרים גבולות, אנחנו מתכוונים לאבטחה
קלוד אופוס 4 פועל ברמת בטיחות 3 של בינה מלאכותית - מדד הייחוס הפנימי של Anthropic.
הנה מה שזה כולל בפועל:
צוות אדום (מבפנים ומבחוץ)
הדרכה ומסננים נגד פריצות ג'איל
הגנות סייבר לשימוש בכלים ובקבצים
ניטור אחר הטיה, נזק או התנהגות לא מדויקת
עדכונים ודוחות שקיפות שהובטחו
זו לא הסמכה עולמית. אבל זה קו ברור שהם משרטטים לעצמם - ודבקים בו.
בטיחות ואבטחה של בינה מלאכותית: קלוד 4 נגד השטח
ספק | דֶגֶם | מסגרת בטיחות | צעדים מרכזיים | הערות |
אנתרופי | קלוד אופוס 4 | רמת בטיחות בינה מלאכותית 3 | Red-teaming, מסנני פריצה, אבטחת סייבר, מעקב סיכונים | הצהרה עצמית, כולל ביקורת חיצונית + ניטור |
בינה מלאכותית פתוחה | GPT-4 | אמצעי הגנה פנימיים | RLHF, ניהול, ממשקי API מוצפנים, SOC 2 | אין קנה מידה של בטיחות הציבור; מתמקד בתפוקה מזיקה |
גוגל | מַזַל תְאוּמִים | מסגרת סיכונים פנימית | בדיקות הטיה, מסנני כלים, בדיקות עובדות, הערכות עוינות | צוותי בטיחות משולבים טרום השקה |
מטא | LLaMA 3 | כלי לאמה סגולים | שומר לאמה, שומר פרומפטים, חומות אש | קוד פתוח; האבטחה נשלטת על ידי המפתחים |
מיסטרל | דגמי מיסטרל | ממשק API לניהול | מסנני שפה, מצב בטוח, הצפנה | ניתן להתאמה אישית; פחות ברירות מחדל, פתוח יותר מנקודת העיצוב |
שורה תחתונה
מה יוצא עכשיו: קלוד אופוס (מתקדם), סונטה (ברירת מחדל), הייקו (קל משקל)
השתמש בזה כאן:
אפליקציית אינטרנט, API ו-iOS זמינותשימוש בכלי: העלאת קבצים, פונקציות ואחזור - מובנה
זיכרון: פעיל באופוס ובסונטה, ניתן לעריכה בכל עת
חלון הקשר: עד 200,000 טוקנים
רמת בטיחות: אופוס פועל ב-ASL-3 של אנתרופיק
תמחור API:
אופוס: ~15 דולר נכנסים / ~75 דולר יוצאים לכל מיליון טוקנים
סונטה: ~3 דולר נכנסים / ~15 דולר יוצאיםרמה חופשית: כן - קלוד סונט
- קרא עוד
הגרסה הזו לא נועדה להיות ראוותנית. היא נועדה לתת לבינה מלאכותית את המבנה כדי באמת לעזור.
פרספקטיבה של צוות האור הקפוא
קלוד הוציא בדיוק אלבום חדש.
והוא מלא בכל המילים ששמענו בעבר.
חשיבה. בנוי לקוד. בנוי למשימות.
וכמובן - דגש חדש על אבטחה.
אבל זוהי הגרסה הפנימית שלהם למה המשמעות של "מאובטח".
וכנראה שהם עומדים בסטנדרט הזה.
(הערה צדדית: אם כתבת את התקן ולא עמדת בו, זו תהיה האמת.)
אז איך אפשר להבין את זה?
אתה מסתכל על החברה.
מכיוון שעסקים קיימים כדי להניע הכנסות באמצעות ערך.
והשאלה האמיתית היא:
האם הערך שהם יוצרים באמת תואם את מה שאתם צריכים?
אם אתם צריכים הקשר, הנה מה עוד קרה השבוע:
אנחנו ב-Frozen Light כתבנו על:
גוגל בילד - המקום שבו ג'מיני התחברה לג'ימייל, טלפונים, יצירת וידאו וכל מה שיכלו
רשימת מחירים חדשה יוצאת לרחבי המערכת האקולוגית של גוגל
OpenAI רוכשת חברת חומרה - מתרחבת ממודלים לאופן שבו אנו מקיימים איתם אינטראקציה
OpenAI גם מתקדמת במהירות על תוספים של Spotify, אינטגרציות של סביבות עבודה ועוד
זה מצייר תמונה.
אם אתם חברת תואר ראשון במשפטים עם פלטפורמה, הפצה ומשתמשים - אתם כבר משובצים.
אתה בונה מבפנים. אתה חלק מתהליך העבודה של אנשים.
לקלוד אין את זה.
אז הם צריכים להיות הכי טובים.
אבל הכי טוב במה?
כרגע, התשובה נראית כך:
היה תואר שני במשפטים בטוח.
יותר בטוח.
יותר מובנה.
וליצור את סוג החוויה שהם מאמינים שמשתמשי בינה מלאכותית צריכים עכשיו.
וזו הסיבה שהשדרוג החדש של קלוד חשוב -
כי הם היו צריכים לבנות תקנה משלהם ולעמוד בה (קריצה, קריצה).
אבל היי - זה עדיין הסיפור שלהם לספר, גם אם הם בונים אותו תוך כדי בנייה.
בסופו של דבר, העצה הטובה ביותר שאנחנו יכולים לתת לך היא זו:
בדקו מה אתם באמת צריכים - וראו אם כיוון העסק של קלוד, שמסמן בבירור את המטרות ארוכות הטווח שלהם, תואם את שלכם.
וכן - תתרגלו לרעיון שאולי תצטרכו יותר מתואר אחד במשפטים.
זה לא אחד נגד השני.
זה: מה אני צריך, ומי באמת יכול לספק את זה?