» «
צ'אטבוט
איך הופך הצ'אטבוט לרובוט האינטרנט החדש?



בעשור האחרון אנו הולכים ונחשפים לשירותים, כמו פייסבוק שפתחה את שירות ההודעות שלה, Messenger, לצ'ט-בוטים (Chatbots) או ל-OpenAI שמנפיקה בוט חכם במיוחד כמו ChatGPT ומאפשרת לאלפי שירותים של צ'אט בוטים כאלה להיווצר תוך זמן קצר, תוך התבססות על GPT, הבינה המלאכותית שהיא פיתחה.

הן לא היחידות כמובן.

צ'אט בוטים הם רכיבי תוכנה קטנים, מעין תוכנות זעירות, שחוסכות לנו זמן ומאמץ. למעשה, הצ'אט-בוט הוא מעין רובוט תוכנה שמקבל מאיתנו הוראות ורץ לבצע.

יש בוטים אינטליגנטיים, המצוידים ביכולות של "עיבוד שפה טבעית" (NLP). כלומר, ניתן להתכתב עם בוטים שכאלה, ממש כאילו היו בני אנוש - כותבים להם בשפה יומיומית, שפה אנושית, והם "מבינים" אותנו. היכולת של NLP לחסוך לנו כתיבה טכנית, בתחביר שמיועד להפעלת מכונה אבל לא באמצעות קוד, היא נפלאה.

מאז סוף שנת 2022 היכולת הזו מתפתחת במהירות אדירה ועתידה להתפתח עוד ולהקל את התקשורת מולם, עם בוטים חכמים שמבינים גם דיבור אנושי ומנהלים שיחה קולית, באמצעות Speech To Text.

כמה מהר עברנו מבוטים שהתבססו על בחירה מתוך תפריטי אפשרויות מוכנים מראש לשיחה חופשית בכתיבה ודיבור בלשון יומיומית, כלומר שפה טבעית.

מסתבר שאת רוב הפעולות בעולם יכולים צ'ט-בוטים לבצע בלי למצמץ ולחסוך לנו זמן רב ואף שגיאות ששוות לא פעם להמון כסף. צ'אטבוט שמאפשר הזמנת פיצה, למשל, יחליף את איש הפיצריה שעונה לטלפון. לבקשתכם הוא יציג את התפריט, יאפשר להזמין, לבקש תוספות מתפריט או לבחור את מידת החריפות ולשלם בקלות ובמהירות. אחרי שהבוט מטפל בכל שלבי ההזמנה ומוציא הוראת הכנה למטבח הפיצריה, נותר ללקוח רק להמתין לפיצה המהבילה שתגיע אליו.

כלומר, כל מה שהיום עושים החבר'ה המותשים בסניף הפיצריה, יכול הבוט לבצע בנינוחות ממוחשבת ובדייקנות מביכה, אם מהמסנג'ר של פייסבוק או מאפליקציות כמו ווטסאפ וטלגרם.

כמובן שמטרתה של פייסבוק הייתה ונשארה שהמשתמשים יעשו הכל בפלטפורמה של החברה, מבלי להשתמש בתוכנות, אפליקציות או כלים חיצוניים. כמה שיותר נקבל אצלה בבית - נישאר עוד יותר זמן, נחזק את שביעות הרצון מהרשת החברתית שלה ובעיקר נכניס לה כסף.

על הדרך היא חוסכת לנו הורדה והתקנת של אפליקציה נפרדת לכל עסק, לימוד של הממשק של כל אפליקציה כזו (כלומר של הדרך שבה היא מתקשרת עם המשתמש) וכדומה.

צ'ט-בוטים הם לא דבר חדש. כבר בימי ה-IRC, עידן הדינוזאורים של הרשת, פעלו בוטים שונים שאפשרו ביצוע פעולות פשוטות מול תוכנה. היום יכולים גופים עסקיים ואתרים שונים לבצע פעולות דרך הצ'אט-בוטים, אבל הרעיון נשאר כשהיה - אדם מצ'טט עם תוכנה, שמבצעת בשבילו משימות, במהירות ויעילות ובקרוב גם בלי שיהיה הבדל לעומת שיחה עם נציג אנושי.


הנה הסבר של הצ'ט בוטים החדשים:

https://youtu.be/mmmaLe8KM-o


מארק צוקרברג מנכ"ל פייסבוק מציג את הצ'אטבוטים ומדגים:

https://youtu.be/EOYnFUJyOlQ


הסבר איך הצ'ט-בוט עובד:

https://youtu.be/MT4JWtm5n5M


ובפינת ההומור שלנו - זה מה שקורה כשמדענים נותנים לשני בוטים אינטליגנטיים לשוחח זה עם זה:

https://youtu.be/WnzlbyTZsQY
צ'אטבוט
מה בין צ'אטבוט, LLM וסוכן AI שמבצע משימות?



צ'אטבוט (Chatbot) הוא סוג של סייען חכם וממוחשב, שניתן לשוחח איתו בהתכתבות צ'אט, או במקרה של צ'אטבוט מתקדם יותר גם שיחה מבוססת דיבור.

כמובן שהצ'אטבוט הוא מערכת מבוססת AI (בינה מלאכותית, או אינטליגנציה מלאכותית) שמייצרת שיחה מלאכותית עם המשתמש - מבלי שבצד השני נמצא אדם אמיתי.

בעשור השני של המאה ה-21 הצ'אטבוט הלך ותפס את מקומו ברשת ובאפליקציות שונות והפך לדרך חדשה לחלוטין להשתמש באינטרנט. לקוחות מצאו את עצמם מנהלים התכתבות בצ'אט או שיחה אוטומטיות עם בוט, שנתן מענה מותאם אישית ושיפר את עצמו עם הזמן.

הצ'טבוט הבטיח לספק שירות לאורך כל שעות היממה, 24/7. הוא סימן הפחתה של המון מהעומס של שירות הלקוחות האנושי, חסך זמן למתעניינים וללקוחות שביקשו שירות וחסך לעסקים הרבה כסף.

התגלה שבוט AI ממוקד ואיכותי מסוגל להציע תגובות מהירות ומדויקות, מה שהוביל לשיפור ניכר בחוויית הלקוח ולעלייה בשביעות הרצון, אף שהיו לקוחות שהתעקשו לשוחח עם בן אדם, שהיה עמוס עכשיו פחות ולכן גם זמין להם הרבה יותר.

היתרונות של הצ'טבוט בטיפול אישי במשתמש ובלקוח היו עצומים. שולבו בו טכנולוגיות פרסונליזציה מתקדמות שהלכו והתפתחו, תוך גיוס הבינה המלאכותית לצרכי השיווק, המכירות והתמיכה.

רבים חזו שצ'אטבוטים עשויים להחליף חלק ניכר מהשימוש באתרי שירותים שונים ולייתר אותם בעתיד, מה שהתממש אבל חלקית.

בזמנו החליטה פייסבוק להשתמש בצ'אטבוטים בתוך שירות המסרים שלה מסנג'ר. היא אפשרה למפתחים חיצוניים לפתח צ'אטבוטים שיתנו שירותים ומידע מאתרים אחרים. ההכרזה על פלטפורמת הצ'אט בוט של פייסבוק מסנג'ר קדמה את רעיון הצ'אטבוטים המקוונים באופן משמעותי, במיוחד למשתמש הנייד בסמארטפונים ושעונים חכמים, אם כי הזינוק הטרנדי שנוצר עם ההשקה הלך ונרגע עם הזמן.

ההבשלה של אותם צ'אטבוטים באה בעשור הבא דווקא. זה קרה עם הגעתו של ChatGPT, מודל השפה הגדול הראשון (LLM), שאחריו הגיעו נוספים, כמו Gemini או Claude. מודל השפה הזה הוא בעיקרון מנוע בינה מלאכותית גדול ורחב-אופקים, המצויד ביכולת להבין שפה טבעית, אנושית, ויכול לעשות המון דברים, כלומר להתמודד עם מגוון ענקי של משימות ושהיכולות שלו הולכות וגדלות מיום ליום. ראו בתגית "LLM".

ממודלי השפה הגדולים התפתחו גם מנועי היצירה של הבינה הג'נרטיבית (Generative AI), המייצרים תמונות, שירים, וידאו ועוד. הכירו בתגית "GenAI".

אחריו נולדו סוכני ה-AI, צ'אטבוטים שממלאים משימות עבורך, על ידי שילוב בין היכולת הבינתית של מודל השפה הגדול כמו ChatGPT, עם היכולת של רכיב תוכנה שיכול לפעול באופן עצמאי וממוקד, למילוי של משימה ספציפית עבורנו, כמו לתכנן טיול, לקנות מוצרים אונליין, לטפל בדואר האלקטרוני שלנו וכדומה.

אותם סוכני AI הם רכיבי תוכנה אוטונומיים, יישומים מבוססי בינה מלאכותית, המסוגלים לתפוס את סביבתם, לקבל החלטות ולפעול לביצוע או השגת מטרות ממוקדות בשירות המשתמש. הכירו אותם בתגית "סוכני AI".

כלומר, אם הצ'טבוט של העשור שהחל ב-2010 היה עובד חרוץ אך לא חכם מדי, הצ'טבוט הבינתי של מודל השפה הגדול בעשור שאחריו רכש השכלה ופיתח את יכולותיו האינטליגנטיות באופן שהפך אותו למומחה ואז מגיע הסוכן הבינתי, AI agent והוא כבר עובד שמתמחה במשימה מסוימת ועושה אותה בצורה מיומנת וחרוצה.

עסקה טובה לרובנו.


פעילות נחמדה
============
בקישורים שלמטה יש לינק לצ'ט בוט נהדר. נסו לשוחח איתה (באנגלית) ולהכיר קצת את חוויית השיחה עם צ'ט בוט אופייני.


הנה עולם הצ'אטבוט:

http://youtu.be/iE9LtfQAYYU


עוד על השימוש בצ'אטבוטים ברשת:

http://youtu.be/G8z--x5tFOI


ההכרזה על הצ'אט בוט במסנג'ר של פייסבוק:

http://youtu.be/EOYnFUJyOlQ


ומנגד - כשהושק הצ'אטבוט של מיקרוסופט הוא "הסתבך" עם ביטויי גזענות קשים:

http://youtu.be/LA49GBcbudg
טפשת הרשת
מהי טפשת ה-AI שתפגע באיכות התוכן והקוד?



אחת התופעות שמתחילות להתגלות בשנים האחרונות, מאז הפריצה של הבינה המלאכותית הגנרטיבית, היא של טפשת שגורמת הבינה הגנרטיבית למידע ולתוכן באינטרנט.

ברור שהשימוש הכל כך קל ב-Generative AI מקל על המשתמשים, אבל ידוע לכל שיש לבדוק את המידע שהיא יוצרת לפני שמחזירים אותו לציבור כמידע שיצרו בני אדם. מסתבר שרבים לא מבינים את החולשות והפגמים שעדיין מלאים בהם מודלי השפה, אותם מודלים גדולים (LLMs) שעושים היום את הידע. אם אלה תכנים שהתקבלו מקלוד או ChatGPT, רכיבי AI שנועדו לייצר קוד בתכנות, וידאו או תמונות גנרטיביות שיוצרים מנועים שונים ועוד.

התופעה הזו כבר פוגעת באיכות המידע באינטרנט, לפי בדיקות אובייקטיביות שעורכים באופן תקופתי לאיכות הרשת. מסתבר שלא זו בלבד שבני אדם מסתמכים על מידע שחלקו לא מדויק בלשון המעטה, אלא שהקרולרים עצמם, אותן תוכנות שאוספות את המידע מהרשת לצורך אימון, הזנת ועדכון מודלי השפה הגדולים - מסתבר שהם עצמם מסתמכים על המידע הגרוע הזה. ובדיוק כך, הוא חוזר למודל השפה ונכנס לתוכן שמקוטלג לטוקנים (Tokens) ובחזרה לדאטה שעליו הם מסתמכים. התוצאה היא שיותר ויותר מידע לא בדוק ולא אחראי, שהגיע מלכתחילה לרשת ממודלי שפה לא בשלים מספיק, חוזר ומפרה את המודלים הבוגרים, שאמורים לקבל מידע אנושי ואיכותי ולא תמיד יודעים לאתר את השגיאות שבו.

גם בעולם העסקים והארגונים יש כבר החמרה. הירידה באיכות התוכן שבאינטרנט נובעת מהשימוש הגובר והולך בחומר בינוני, שהגיע מהבינה המלאכותית הגנרטיבית, אך לא בוגרת, של הדור הראשון. כבר עם ההשקה של ChatGPT ב-2022, גילו מנהלים את הצ'טבוט שמאפשר להם ליצור חומרים באמצעות בינה מלאכותית יוצרת (generative AI) וחיפשו דרכים להשתמש בהם, במקום בעבודה של עובדים או חברות מיקור החוץ שבהם השתמשו בעבר. מעט מאותם מאמצים התגלו כיעילים ומרביתם נשארו בפוטנציאל יותר מאשר החליפו עובדים.

אך בתחום התכנות זה כן קרה. מסתבר שמודלים כמו CoPilot, Claude ואחרים מייצרים קוד במהירות ומחליפים את הג'וניורים, המתכנתים הצעירים בתעשייה. לפי סקרים שמתפרסמים בעולם נראה שקצב האימוץ של המנועים הללו הוא גבוה, במיוחד ביחס לזמן הקצר שבו הם פועלים. אלא שבסוף 2024 מתחיל להסתבר שכ-40% מהמתכנתים בעולם משתמשים בכלים כאלה ומשגרים קוד שלפחות בחלקו הוא פחות מוצלח. קוד זה חוזר ו"נלמד" על ידי המודלים ומוריד את איכות התכנות שלהם באופן מתמשך, שעלול אף להחמיר.
אלייזה
מה הייתה תוכנת השיחה אלייזה?



"אלייזה" (Eliza) הייתה תוכנת שיחה, צ'אטבוט, שנולדה בשנת 1966 וחיקתה שיחה עם פסיכולוג. אלייזה נכתבה על ידי ג'וזף וייצנבאום, מדען מחשב וחוקר מ-MIT, כסוג של פרודיה על טיפולים פסיכולוגיים ופסיכותרפיה, בשיטת קרל רוג'רס. שיטה זו נחשבה בשנות ה-60 להצלחה גדולה. וייצנבאום ואנשיו באוניברסיטת MIT שבבוסטון הופתעו אז לגלות שרבים הגיבו אל 'אלייזה' ממש כאילו הייתה מטפל אמיתי ולא תוכנת מחשב פשוטה.

למרות ששיחה עם אליזה מרגישה לא פעם כשיחה עם דובר אינטליגנטי והיא מגיבה ומתקשרת באופן שנראה הגיוני, בפועל אלייזה אינה חכמה. היא הייתה אז רק סימולציה לשיחה עם פסיכולוג ועל אף שרבים קיוו שהיא תבונית, טענת המפתח הייתה חד-משמעית - אלייזה אינה מצוידת בבינה מלאכותית של ממש!

הטריק של וייצנבאום ואנשי MIT שפיתחו אותה היה לגרום לתוכנה לזהות מילות מפתח בדברי המשוחח עמה ולהשתמש בהן בתשובותיה באופן מתוכנת. דוגמאות לזיהוי מילות מפתח בתחום הטיפולי ולשימוש בהן לקידום השיחה, לא חסרות. נניח שהדובר אמר לאלייזה שהוא עצוב, התוכנה הייתה מגלה את מילת המפתח "עצוב" ושואלת אותו בצ'אט "למה אתה חושב שאתה עצוב?". אם הוא אמר שהוא שמח אז התגובה יכולה להיות כמו "ואיך ההרגשה להיות שמח?"

על שאלות ללא מילות מפתח אלייזה נהגה לשאול אז "האם שאלה זו מעניינת אותך?" או "מה מעניין אותך בשאלה זו?".

כך הולכת ונוצרת נוצרת שיחה משעשעת שכמעט יכולה להביא למחשבה שמדובר במטפל מבין ונבון. בשנות המחקר התגלה שאנשים ייחסו למילים של אלייזה משמעות רבה והתייחסו אליה לא פעם באופן רגשי, ממש כמו אל פסיכולוג אנושי.

באותה תקופה היו שדיברו על יכולותיה של אלייזה כתוכנה חכמה, שאולי תוכל לעמוד ב"מבחן טיורינג" אפשרי. אבל היא לא עשתה זאת, כפי שהצהירו מראש המפתחים. בכל זאת נרשמה אז אכזבה ברורה מכך שאלייזה לא באמת התגלתה כבעלת בינה מלאכותית. מדובר היה בשנות ה-60, עידן שבו כל המחשוב מבוסס המסוף (מקלדת ומסך המתחברים למחשב מרכזי) היה חדשני מאד והציפיות היו גבוהות מהיכולות האמיתיות של עולם המחשבים. רק 15 שנה אחר כך יגיעו המחשבים האישיים, ועוד 30 שנה יעברו, בטרם יתחילו לפעול מנועי חיפוש כמו "אסק ג'יבס", שהתבססו על עיבוד שפה טבעית, כשלצידן פועלות גם תוכנות ומערכות עזרה ממוחשבות "חכמות" מהסוג של "קליפי", שצורף אז ל-Windows.

הכישלון של אלייזה, עד כמה שהוא היה צפוי, היה אחת הסיבות לפתיחתו של העידן שנקרא אז "החורף של הבינה המלאכותית", תקופה שתימשך עד אמצע שנות ה-2000 ותתאפיין באכזבה מהבטחת האינטליגנציה המלאכותית.

גם היום אלייזה מסוגלת לגרום לדוברים עימה לשכוח שהיא מכונה, במצב שנקרא "השעיית חוסר האמונה". את אלייזה ממשיכות כיום תוכנות הצ'אטבוט (Chatbot). מדובר בסוגים של סוכנים חכמים, סוכני AI או סייענים חכמים, שבאחרונה הולכים ותופסים את מקומם בחיינו. הם עשויים להפוך לדרך חדשה לחלוטין להשתמש באינטרנט. במיוחד מכיוון שאנשים מאמינים להן ובהן.

ואגב, מקור השם "אלייזה" הוא בשמה של גיבורת "פיגמליון", המחזה הנודע של ג'ורג' ברנרד שו.


הנה סיפורן של השיחות עם תוכנת אלייזה ההיסטורית:

https://youtu.be/itYWwMJr1X4


שיחה עם תוכנה דמויית אלייזה על מחשב הקומודור:

https://youtu.be/4sngIh0YJtk


השיחות עם אלייזה:

https://youtu.be/CJWOOTMt4ko


מפגש בין צ'אטבוטים - בין העוזרת הווירטואלית של האייפון, סירי, לתוכנת אלייזה:

https://youtu.be/uTiLverShyc


וממשיכיה של אלייזה בעולם הצ'אטבוט:

http://youtu.be/iE9LtfQAYYU

צ'אטבוט

מודל היגיון
מהו מודל היגיון, או Reasoning Model?



מודל היגיון (Reasoning Model) הוא מודל שנועד לחקות את תהליך החשיבה האנושית ולהסיק מסקנות לוגיות על בסיס מידע נתון.

מודלי ריזונינג נוטים להיות כבדים יותר ולספק תובנות עמוקות, באמצעות הסקה רב-שלבית, מורכבת ומעמיקה. כמובן שהם משתמשים בטכניקות של בינה מלאכותית ולמידת מכונה כדי לנתח נתונים, לזהות דפוסים ולהסיק מסקנות מבוססות עובדות.

בדרך לתת תשובה מחלקים מודלי הגיון את פתרון הבעיה לשלבים, מתעכבים על התשובות, מהרהרים, בודקים, לעתים מתקנים את עצמם (בתכנות רואים את זה היטב) ומבצעים תהליכי ניתוח מורכבים.

בגדול - הם מבצעים חשיבה מתמשכת ומבוססת יותר מזו של מודלי שפה רגילים.

מודל הגיון שכזה מתאים מאוד לפתרון ברמת דוקטור (PhD) של בעיות מורכבות, בעיקר מתמטיות, מדעיות והנדסיות. הוא מושלם לחישובים מורכבים ודברים כמו מתמטיקה, פיזיקה, פיתוח קוד והסקת מסקנות.

ואגב, מודל ריזונינג דורש כוח מחשוב משמעותי מהרגיל, לפחות במקרה של מודל ChatGPT 4o1 של OpenAI וקצת פחות במודל הסיני המפתיע DeepSeek, שפותח לכאורה בגרושים ומראה תוצאות מרשימות בדרישות חומרה נמוכות בהרבה.


#החשיבה דרך הבעיה
מודל היגיון, הוא מודל מנומק, שמשתמש בהיגיון כדי "לחשוב דרך" הבעיה ולהיות מסוגל גם להראות את תהליך החשיבה שביצע, לפני שנותן את התוצאות. זאת בניגוד למודלים הרגילים שמבצעים אופטימיזציה סבירה, רק כדי שיוכלו לספק את התשובה המהירה ביותר (שזה מה שגם גורם לא פעם למודל שפה רגיל לתרום לנו בדרך את ה"הזיות", אותן Halucinations המוכרות לנו כל כך).

בקיצור, אם מודל שפה רגיל הוא הבחור הטקסטואלי שהוא אלוף על טקסטים ועונה מהר, מודל ההיגיון הוא הנערה המבריקה והריאלית, שיכולה לפצח בעיות מופשטות, מתמטיות, פיזיקליות ומדעיות בתחומים ומדעים מדויקים, בלי למצמץ ועם יכולת לנמק ולהסביר את הפתרון שאליו היא מגיעה, צעד אחר צעד.

מודל כזה מבצע לעתים קרובות "שרשרת מחשבה" (Chain of Thought) ולכן גם מכונה כך לפעמים. המודל חושב צעד אחר צעד, בצורה שמזכירה את האופן שבו אנו, בני האדם, עשויים לגשת לאתגר משמעותי יותר כמו פיתוח אפליקציה חדשה, תכנון חופשה או בניית בית.


#היתרון
משמעותו של מודל כזה היא ביכולת שלו לספק תשובות מדויקות ומושכלות לשאלות מורכבות, לפתור בעיות ולקבל החלטות מבוססות נתונים. לכן וכדי להצטיין בבעיות מסובכות יותר, מומלץ להזין אותו בכמה שיותר הקשר, קונטקסט (Context) לגבי הנושא והגישה לפתרון.


#במה הם יכולים לעזור לנו?
מודלים כאלו יכולים לנתח כמויות גדולות של נתונים במהירות ובדיוק, לזהות דפוסים ולהסיק מסקנות. הם יכולים לפתור בעיות מורכבות על ידי שימוש בלוגיקה ובאלגוריתמים מתקדמים.

ביכולתם גם לסייע בקבלת החלטות מבוססות נתונים, מה שיכול להיות מועיל בתחומים כמו רפואה, כלכלה וניהול. בנוסף, הם יכולים להסיק מסקנות לוגיות על בסיס הנתונים שנתונים להם, מה שיכול לסייע בתחזיות ובתכנון.

מודלי ההיגיון יכולים לחסוך זמן ומאמץ בביצוע משימות מורכבות, מה שמאפשר למשתמשים להתמקד בפעילויות אחרות. ביכולתם לספק תשובות מדויקות ומבוססות עובדות, מה שיכול להיות מועיל בתחומים כמו רפואה, משפטים והנדסה.

מודלים אלו מסייעים בקלות בקבלת החלטות מושכלות ומבוססות נתונים, מה שיכול להיות מועיל בחיי היומיום ובעבודה והם יכולים גם לסייע בפתרון בעיות מורכבות במהירות וביעילות, מה שיכול להיות מועיל בתחומים רבים.

ברפואה, מודלי היגיון יכולים לסייע באבחון מחלות ובמתן המלצות לטיפול על בסיס נתונים רפואיים.

בכלכלה, ניתן להסתייע בהם בניתוח שוק ההשקעות ובקבלת החלטות כלכליות מבוססות נתונים.

בחינוך, המודלים הללו יכולים לסייע בהוראה ובלמידה על ידי סיפוק הסברים מדויקים ומושכלים לשאלות מורכבות.

בניהול, הם מעולים הסיוע לניהול משאבים מוצלח ובקבלת החלטות ניהוליות מבוססות נתונים.

אז אם לסכם, מודל היגיון הוא כלי חזק שיכול לסייע במגוון רחב של תחומים ולשפר את איכות החיים של המשתמשים, על ידי סיפוק תשובות מדויקות ומבוססות עובדות. עם יכולותיו הוא מאפשר לנתח נתונים במהירות, לפתור בעיות מורכבות ולקבל החלטות מבוססות נתונים, מה שהופך אותו לאחד הכלים החיוניים ביותר בדור החדש של העידן הדיגיטלי מבוסס הבינה המלאכותית.


הנה מודל ההגיון הסיני Deepseek R1 שיודע לחשוב מראש, לתכנן, להשוות כמה תשובות אפשריות, לפרק את הבעיה לחלקים, לחזור אחורה ולחשוב מחדש על השאלה וכך לענות היטב על שאלות קשות, מורכבות ועד לא מזמן בלתי אפשריות למודל שפה:

https://youtu.be/-2k1rcRzsLA


דוגמה לבעיות פשוטות מהחיים שמודל מנומק יכול לפתור:

https://youtu.be/yQampjl6gPI


שניים כאלה:

https://youtu.be/rzMEieMXYFA


ו-DeepSeek R1 הוא מודל מנומק בקוד פתוח:

https://youtu.be/yT3KGbiA09Q
מודל שפה גדול
מהם מודלי שפה גדולים, או LLM?



מודל שפה גדול (LLM), קיצור של Large Language Model, הוא ה"מוח" שמפעיל צ'אטבוט עוצמתי, כמו הצ'אטבוט ChatGPT, המייצר תוכן לבקשת המשתמשים ועושה זאת באמצעות מודל השפה הגדול GPT-4 ואחרים.

את התוכן מייצר הצ'אטבוט מדאטה עצום, כמות מידע אדירה שנשאבה מהאינטרנט ובאמצעותה אימנו את מודל השפה שמפעיל אותו. מודלי השפה GPT-3 ו-GPT-4, למשל, הם שמפעילים את הצ'אטבוט הכי מפורסם ChatGPT.

יש שאומרים שמודל השפה בעצם הוא לא יותר ממחולל מילים סטטיסטי. הם צודקים אבל גם טועים. כי מודל שפה יכול לחשב מצוין הסתברות של הופעת מילים שונות בכל משפט וכך לייצר משפטים חדשים, מילה אחר מילה, בשפה שבה הוא אומן על ידי המפתחים שלו. אבל זו דוגמה בלבד ואפילו קצת מטעה. כי סטטיסטיקה זה לא הכל וכנראה לא לגמרי המהות של העניין. המוח של מודל השפה, האופן שבו הוא בנוי והתובנות והביצועים שהוא יכול לנפק, הם משמעותיים הרבה יותר.

מודל כזה הוא תת-תחום של למידה עמוקה ומבוסס על רשת עצבית מלאכותית הבנויה בצורה דומה למוח האנושי. הרשת הזו היא בעלת כמות אדירה של פרמטרים, לרוב מיליארדים. הפרמטרים הללו הם ערכים מספריים שמסייעים לאלגוריתם ללמוד.

עוד ביטוי לגודלו הגדול של המודל הוא באימון שלו על מאות מיליוני מילים, בכמויות ענק של טקסט לא מתויג, בשיטת למידה שאינה מסתמכת רק על דוגמאות אנושיות, או מה שנקרא "למידה בפיקוח-עצמי".


#איך זה בדיוק עובד?
נניח ששאלתם שאלה, מודל השפה הגדול מניח את נוסח השאלה על שולחן הטיפולים שלו ובודק בדאטה שלו, במידע העצום שהוא אגר והמיר לקוד מתמטי (ראו אח"כ בתגית" טוקנים"), מה המילה שהכי סביר (מבחינת הסתברות) שתתחיל את התשובה. ואז הוא בודק מה המילה עם ההסתברות הכי גבוהה להופיע אחריה וכך הלאה. זה ייתן לו את התשובה הסבירה ביותר לשאלה.

למה הכי סבירה ולא הכי טובה? - כי הסתברות היא לעולם לא מושלמת וזו בדיוק הסיבה להזיות שנקבל לא פעם ממנועי בינה מלאכותית. אגב, אם תבקשו ממנו לבדוק את תשובתו, כל LLM ימצא ויפרט את שגיאותיו וגם יציע לתקן את המענה שנתן ובתיקון זה כבר יהיה הרבה יותר טוב.

ה-LLM משתמש בייצוג מתמטי של שפה טבעית באמצעות הסתברויות. כל מדען נתונים יאשר שהבסיס של מודלי שפה הוא היכולת שלהם לחשב הסתברות לכל משפט בשפה שבה הם אומנו ומהיכולת הזו נובע חלק משמעותי ביכולת שלהם לייצר משפטים חדשים, מילה אחר מילה.


#מודלי השפה הגדולים והבינה הג'נרטיבית
מודל השפה הגדול הוא בעצם הבסיס למהפכת הבינה הגנרטיבית שפרצה לחיינו בשלהי 2022-תחילת 23. מודלי השפה הגדולים הללו מסמנים קפיצת דרך של ממש ולמעשה הכניסו אותנו עמוק אל תוך העתיד.

הייתה זו IBM שפיתחה את אחד ממודלי השפה הראשונים. הוא נקרא ווטסון, על שם תומאס ווטסון, מייסד IBM. יש גרסה שאומרת שהוא קיבל את שמו משמו משם העוזר של שרלוק הולמס, ווטסון. מודל כזה, ממש כמו אותו עוזר, תמיד מסייע בחקר ובתשובות שונות, כיום של רבים ואצל שרלוק, לצרכי החקירות של הבלש הנודע.

מצוידים במודלים החדשים, הצ'אטבוטים המרשימים, כמו Claude ו-ChatGPT, מסרבים להיות לכם לווטסון. במקום זאת הם מפותחים כך שיהיו המוח, כלומר השרלוק שלכם, כשאתם וכמה זה אירוני, בתפקיד הווטסון או העוזר שלהם... אבל גם הלקוחות.

מודל שפה הוא שמאפשר לנו לבקש ממנו לסכם טקסטים, לענות על שאלות, לצייר או בעצם לייצר תמונות ו"צילומים", לחבר שירים, ליצור סרטונים או לכתוב קוד.

אז מודלי שפה גדולים אפשרו את קפיצת הדרך המדהימה של מהפכת ה-AI. אמנם הם רחוקים מלהיות מושלמים לחלוטין ועדיין פה ושם מקלקלים את ההתפעלות עם ההזיות המוכרות האלה שלהם, עובדות שגויות, מידע לא רלוונטי או מופרך ואפילו עלבונות נדירים. ומה שלא פחות מרגיז לעתים הוא הביטחון המלא שבו הם כותבים או מדברים אותן, שזה בדיוק מה שהופך את חשיפת ההזיות ובדיות הללו לכל כך קשה ומסוכנת...

כיום, המודלים הללו הולכים ומאפשרים צמיחה של עולם חדש, עולם סוכני ה-AI. הם ממוקדים בביצוע משימות ספציפיות, תגובה לסביבה ועוד תכונות מבטיחות. הכירו אותם בתגית "סוכני AI".


הנה מה שעושים המודלים, מנועי השפה הגדולים (מתורגם):

https://youtu.be/X-AWdfSFCHQ


כך פורצת מלחמת עולם ה-AI הראשונה:

https://youtu.be/nJjuYTpHQEE


מהו LLM?

https://youtu.be/iR2O2GPbB0E


המודל השולט בינואר 2025 - DeepSeek R1 הסיני:

https://youtu.be/hupQ97Or3jw


השוואת הצ'טבוטים הטובים, מנועי השפה הגדולים בסוף 2024 (עברית):

https://youtu.be/NanvGTQeO-g


כך פועל מודל השפה הגדול LLM:

https://youtu.be/iR2O2GPbB0E


כך בנויים ופועלים מודלי השפה הגדולים:

https://youtu.be/5sLYAQS9sWQ


יש להם גם חסרונות:

https://youtu.be/Gf_sgim24pI


הסבר מעמיק על מודלים גדולים של שפה ומה שהם הובילו (עברית):

https://youtu.be/-NIsUKUnxhA?long=yes


הפרמטרים והטוקנים באימון מודלים כאלו:

https://youtu.be/r17HV0TzAWw?long=yes


ובאופן סטטיסטי - כך פועל LLM:

https://youtu.be/LPZh9BOjkQs?long=yes
מודל שפה קטן
מהו ומה היתרון של מודל שפה קטן, או SLM?



מודל שפה קטן (Small Language Model), ובקיצור SLM, הוא מודל מתמחה או מומחה, דגם קטן יותר ומזוקק, מה שהופך אותו להבטחה גדולה וממשית לצרכים עסקיים, בעולם האמיתי.

מודלים קטנים של שפה, או כמו שתרגום מכונה מכנה בטעות "מודלים של שפות קטנות", מאפשרים היום אימון בינה מלאכותית על ידע ספציפי לתחומים שונים ובכך להתאימם לתעשיות ספציפיות, משימות וזרימות עבודה תפעוליות.

SLM הוא קצת כמו סוס חזק ומהיר שיכול לבצע משימות ממוקדות, לעומת כרכרות LLM עמוסות, כבדות ולכן גם מוגבלות בתמרון.

שוב ושוב נשאלת השאלה האם יכולים מודלי שפה קטנים (SLMs) לנצח את ה-ChatGPTים או ה-Claudeים למיניהם, את האחים הגדולים והוותיקים, המצוידים, מאומנים ועתירי המשאבים מעולם ה-LLMs?

או במספרים - האם מודל של מיליארד בודד של פרמטרים (1B) יכול לגבור על היכולות של מודל עם 405B פרמטרים, יותר מפי 400 ממנו?

אז כן. בניגוד למודל שפה גדול של עולם ה-LLMs, שמעבד כמויות אדירות של ידע כללי, המודל הקטן מעולם ה-SLMs בנוי במחשבה על דיוק ויעילות. עלות הפעלתו היא נמוכה משמעותית, הוא דורש פחות כוח חישוב ובנוי כדי לספק תובנות רלוונטיות יותר לעסק מאשר מקביליו הגדולים והכלליים.

בעולם המודלים הגדולים של שפה כבר הסתבר שאופטימיזציה של החישובים ב-SLMs כאלה יכולה אכן לעלות את היכולות של הקטנים הללו על אלו של דגמים גדולים יותר, שמנסים ומצליחים להיות חכמים מכולם ויודעי-כל, אבל תפעולם יקר ומסורבל יותר והם לא יעמדו ביכולות ההתמחות של מודל קטן שלא מביט לצדדים ומרוכז רק במשימתו.

מחקרים שבחנו את היעילות של שיטה ששמה Compute-Optimal TTS, למשל, הראו ששיפור הביצועים של מודלים קטנים מאפשר לעלות בהם את הביצועים על אלו של דגמים גדולים יותר, במשימות מתמטיות כמו MATH-500 ו-AIME24 ובשיפור יכולות החשיבה של LLM.


#ביצועים, התמחות ואבטחת נתונים
לא מעט חברות וארגונים מבינים שהשאלה היא לא על איזה מודל בינה מלאכותית אנשים קופצים, אלא איזה מודל יספק לחברה או לארגון ערך עסקי אמיתי. SLMs מאפשרים לעסקים לפרוס AI ישירות על מחשבים ניידים, רובוטים וטלפונים ניידים ולהבטיח בכך גם שהנתונים, הדאטה שלהם, יישארו מוגנים.

דגמי SLM, שמותאמים להצטיין בתחומים ספציפיים - פיתוח תוכנה, רפואה, פיננסים וכדומה, יספקו תוצאות מדויקות ואמינות יותר, המותאמות לצרכי הארגון הייחודיים וליכולותיו.

ה-SLMs המזוקקים והקטנים יותר מצליחים לשמור על יכולות חשיבה חזקות וממוקדות תחום, ביחד עם יעילות המאפשרת להם לפעול באופן מקומי, מבלי להסתמך על מחשוב ענן.


#סוכני AI
אם SLMs מצוינים עבור עסקים הרוצים לייצר משימות אוטומציה שלא נזקקות לכל הרעש והצלצולים שמציע ה-LLM, אז מה עם סוכני בינה משויפים?

אז ברור שגם מפתחים של סוכני AI צריכים דגמים קלים, מהירים ומתמחים מאוד, המאומנים על ידע מעמיק וספציפי לתחום בו מתמחה הסוכן. בזכות דרישות המשאבים המצומצמות והגודל הקטן יותר שלהם, שירותי SLM יכולים בדרך כלל להתאים בול למגמת ה-Agentic AI, בכך שהם מאפשרים קבלת החלטות אוטונומית בקצה.

אמנם מודלי SLM עשויים לדרוש הכשרה מיוחדת מלכתחילה, אבל מנגד עומד היתרון של הפחתת הסיכונים הכרוכים בשימוש ב-LLM של צד שלישי וספקים חיצוניים. זהו יתרון עצום, המצטרף לשאר יתרונותיהם: יכולת הסבר גדולה יותר, ביצועים מהירים יותר ויכולת ביצוע מדויק, עקבי ושקוף יותר, המצטרפים לשליטה רבה יותר על פרטיות ואבטחת הנתונים.


#שילוב של המודלים
כיום מבינים שאמנם אין תחרות ל-LLMs בגודל ובעוצמה, אך הסתמכות יתר עליהם יכולה להוביל לתחושת ביטחון מוגזמת, לשאננות ולטעויות קריטיות שעלולות לחמוק מבלי להתגלות.

כך שאולי LLMs ו-SLMs אינם סותרים אלא משלימים. יתכן שבפועל, SLMs יכולים לחזק את ה-LLMs וליצור פתרונות היברידיים, משולבים, שבהם ה-SLMs ממונים על הביצוע הספציפי והמדויק בעוד ה-LLMs מספקים את הקונטקסט, ההקשר הרחב יותר .


מהם SLMs ומה יתרונות מודלי השפה הקטנים הללו:

https://youtu.be/C4Qt9Hnp6vs


הסבר פשוט וקצר:

https://youtu.be/AlwWuSor_M4


למה לבחור SLM ולאילו מגבלות לשים לב אל מול ה-LLM?

https://youtu.be/Hg8f5bjtsWc


ומודל השפה הקטן של מיסטרל:

https://youtu.be/nCXTdcggwkM
IAMUS
מהו המחשב המלחין?



המחשב IAMUS הוא מחשב שמלחין מוסיקה. IAMUS שהתוכנה שבו יוצרת מנגינות, הרמוניה ומרקמים מוסיקליים נעימים לאוזן, נבנה בידי מדענים באוניברסיטה של מאלגה בספרד.

אם היה מבחן טיורינג ליצירתיות, מעניין אם המוסיקה של המחשב יאמוס הייתה מסוגלת להטעות אנשים מיומנים לחשוב שהיא נכתבה בידי בני אדם. כלומר, האם מלחין וירטואלי היה מצליח להתחזות למלחין בן אנוש..

כמובן שיאמוס המחשב אינו יצירתי כמו בן-אנוש. בשלב הזה הוא בעיקר יודע לבצע את פעולת ההלחנה, על פי הכללים ה"נכונים" שאותם יודע כל מלחין מיומן שלמד וקיבל השכלה מוסיקלית. לגבי היופי והמקוריות של המוסיקה שיוצר המחשב הזה, יש מחלוקת רבה עד כמה הוא "יצירתי".


הכירו את מבחן לאבלייס שבוחן אם מכונה אכן ממציאה רעיונות מוסיקליים בעצמה (מתורגם):

https://youtu.be/Rh9vBczqMk0


למידת מכונה שמסייעת ליוצרים לחבר מקצבים ומהלכים בהיפ הופ:

https://youtu.be/mOjWyRqiDds


הבה נחקור את תוכנת IAMUS של המלחין הממוחשב:

https://youtu.be/KhiupLtyibs


הנה יצירה של יאמוס לקלרינט סולו:

https://youtu.be/FCsbEY9pxTU


להרכב קאמרי:

https://youtu.be/Uq3iKbCNDCM


קטעים מהתקליטור הראשון של יאמוס עם מוסיקה שלו:

https://youtu.be/cv4y_BRJokM


מדריך מגניב להלחנה בעזרת קבצי MIDI שיוצר ChatGPT:

https://youtu.be/tV82Wy-tXRE?long=yes


וכלי AI שמלחין מוסיקה בסגנון יוהן סבסטיאן באך:

https://youtu.be/na2ZOUfUwbs?long=yes


מכונות במקום אנשים
מה זה UBI שישמור בעתיד על מובטלי ה-AI?



מדובר ברעיון מסעיר ויצירתי. הוא נקרא "הכנסה בסיסית אוניברסלית" (Universal Basic Income בקיצור UBI) ובעזרתו יש מי שמנסים לקדם את פני הרעה של הקדמה הבינתית, המאיימת על כל עולם התעסוקה של העתיד.

כוונתו להעמיד לרשות כל אדם הכנסה בסיסית, שמטרתה לסייע בהפחתת ההשפעות של הטכנולוגיה על העובדים. הכנסה בסיסית כזו תחושב על ידי "חישוב בסיסי אוניברסלי" ודי אחיד.

הרעיון הוא להציע הכנסה בסיסית אוניברסלית, מעין תשלום מזומן, ללא תנאים, שיינתן לכל מבוגרי האוכלוסייה, ללא קשר לעושרם ולמצבם התעסוקתי. המטרה היא לספק רשת ביטחון לאנשים שהמשרות והתעסוקה שלהם מאוימות על ידי חידושי הטכנולוגיה, כולל ובמיוחד הרובוטיקה והבינה המלאכותית.

הכוונה היא לאפשר להם לחפש עבודה בתחומים שמדברים אליהם ומעניינים אותם, בדברים שיסייעו להם לממש את עצמם והם יכולים להצליח בהם, לבלוט ולנצנץ - אולי אפילו ליזום עסק משלהם וליצור לעצמם בסיס כלכלי מבלי להיות שכירים, באיום מתמיד של אבטלה...

גם אם שמרנים רבים נוטים לדחות את מה שהם תופסים כרווחה שתקטין את המוטיבציה של אנשים לחפש עבודה ולעבוד, ניסיונות לחלק UBI לתושבי ערים ומדינות בארצות הברית הראו תוצאות חיוביות בדרך כלל. חלק מהתוכניות הללו, אגב, העניקו את התשלומים באופן סלקטיבי לאנשים, על סמך הצורך המוכח או המעמד החברתי שלהם ולא לכל האוכלוסייה כולה.

בין התומכים ביוזמה הזו ניתן למצוא גם רבים מראשי ומצליחני ההייטק, כולל מי שמובילים את התפוצצות ה-AI הנוכחית, ביניהם מנכ"ל חברת OpenAI והאדם הכי חזק בעולם הבינה המלאכותית כרגע, סם אלטמן.

לשיטתו, דווקא בשל החשש שהבינה המלאכותית תלך ותחליף אינספור עובדים אנושיים, כולל אנשים שלמדו מקצועות ורכשו תארים ומומחיות ויהפכו למובטלים, אולי אפילו מובטלים כרוניים, דווקא בצל החשש הזה כדאי לתת את ההכנסה הבסיסית המדוברת.

לשיטתו של אלטמן, כל אזרח יקבל, אולי במקום כסף, חלק ממחשב סופר-מתקדם, שהוא מכנה לצורך העניין GPT-7. כל מקבל כזה, אלטמן גורס, יכול יהיה לעשות כרצונו בחלק שקיבל. יהיו מי שישתמשו בו ויקימו מיזם, למשל טכנולוגי, או יהיו שותפים במיזם כזה, אחרים ירצו אולי למכור את החלק שלהם לאחרים, יהיו שיעדיפו לתרום אותו לטובת מחקר בפתרון בעיות עולמיות, כמו משבר האקלים או חקר הסרטן.

ההנחה של מנכ"ל OpenAI היא שעם הטמעתה של הבינה המלאכותית המתקדמת ביותר ויותר היבטים של חיינו, הבעלות על יחידה של מודל שפה גדול, כזה שהוא מכנה GPT7, עשויה להיות בעלת ערך גדול יותר מאשר כסף. אלטמן רואה עולם בו כל אדם בחברה העתידית יחזיק למעשה חלק מהקידמה והיצרנות העתידית ויוכלו להבטיח לעצמם ולמשפחתם פרנסה בעתיד.


הנה רעיון ההכנסה הבסיסית אוניברסלית (עברית):

https://youtu.be/8rM_-49DPe4


בטלנות? רוגע כלכלי? - על ניסוי ראשון איך זה ישפיע על בני אדם? (עברית)

https://youtu.be/u_-N_AWQQiI


בעלי מקצוע מפחדים על העבודה שלהם (עברית):

https://youtu.be/0AGYOv0sGHg


וסרטון מקיף על ה-UBI ומשמעויותיו (מתורגם):

https://youtu.be/kl39KHS07Xc?long=yes


אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

העולם הוא צבעוני ומופלא, אאוריקה כאן בשביל שתגלו אותו...

אלפי נושאים, תמונות וסרטונים, מפתיעים, מסקרנים וממוקדים.

ניתן לנווט בין הפריטים במגע, בעכבר, בגלגלת, או במקשי המקלדת

בואו לגלות, לחקור, ולקבל השראה!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.