לאחרונה חזרתי לתרחיש של Make.com שבניתי לפני מספר חודשים - עוד לפני שסוכני בטא היו קיימים. בהשראת המערכת, במקור, ג'ק רוברטס (הברוקר המוביל שלנו, המונע על ידי קפה), זה היה הניסיון המוקדם שלי לבנות זרימת ניתוח תמונות דמוית סוכן באמצעות Make, Telegram ו- Claude 4 מ-Anthropic .

שיניתי את המערכת אז סתם בשביל הכיף, אבל הייתה לי סיבה לחזור פנימה: מישהו שאל אם אפשר לאחזר ולנתח תמונות מטלגרם באמצעות Make. זה נתן לי את התירוץ המושלם להחיות את הגרסה הישנה הזו - ולבחון שוב עד כמה קלוד מוצק בכל הנוגע להבנה מעמיקה של תמונות.

בדיקת בינה מלאכותית של חוכמת תמונה בצורה הנכונה

אנחנו לא מדברים על זיהוי תווים אופטי (OCR) בסיסי או על זיהוי עצמים. אני מדבר על הבנה אמיתית - הזנה בתוך דיאגרמה מורכבת וקבלת פירוט מובנה וחכם של מה המשמעות.

עבור בדיקה זו, העליתי דיאגרמת עיבוד חשבוניות עתירת טכנולוגיה דרך טלגרם. הערה חשובה: טלגרם דוחסת העלאות תמונות ומספקת שלוש גרסאות. ממה שראיתי:

  • הראשון דחוס במיוחד.

  • השני הוא טווח ביניים.

  • השלישי הוא בדרך כלל המקורי , וזה זה שאתה צריך לניתוח נכון.

אז סיננתי את המערכת כדי לתפוס את התמונה השלישית ושלחתי אותה לקלוד דרך Make.

מה קרה אחר כך?

קלוד (במקרה הזה, סונט) צדק בול .

זה לא רק אמר "זו תרשים" או "יש כמה חשבוניות". זה זיהה את זה נכון כמערכת לעיבוד חשבוניות, לאחר מכן פירק קשרים , זיהה ישויות והחזיר ניתוח מובנה - כמעט כמו תגובת JSON חכמה.

זה תפס דברים כמו:

  • חשבוניות עם מספר עסקאות

  • שינויי סטטוס בתהליך העבודה

  • המבנה הכללי והכוונה של המערכת

הכל מתמונה אחת. ללא רמזים ידניים. ללא פירוטים שלב אחר שלב. רק חשיבה חזותית טהורה.

למה קלוד עדיין מנצח

היו דיבורים על דגמים חדשים שיגיעו לכס המלוכה - GPT-4o, ג'מיני, מה שתרצו. אבל לא ראיתי אף אחד מהם משתווה באופן עקבי לקלוד בכל הנוגע להבנת תמונה עמוקה בפועל .

ולמען הסר ספק: לא אני המצאתי את הרעיון של פירוק ויזואליה בצורה כזו. ראיתי אחרים משתפים דרכים מדהימות לנתח תמונות ולהחזיר פלט מובנה. פשוט בניתי על זה, הוספתי קצת כיף בתהליך העבודה, ווידאתי שהאינטגרציה עם טלגרם עובדת.

רוצה לנסות את זה?

הנה ההנחיה בה השתמשתי כדי שתוכלו להתנסות בעצמכם. שחקו קצת. דחפו את זה. ספרו לי אם אתם חושבים שמשהו אחר עושה עבודה טובה יותר.

אבל נכון לעכשיו? קלוד עדיין מלך הראייה של הבינה המלאכותית .

- מקס

Expert Voices

Frozen Light Team
Frozen Light Team

Anthropic Just Dropped New AI Models: Claude 4

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.