שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.
»
«
מהי המהפכה התעשייתית הרביעית?
שמתם לב שאנו נמצאים בליבו של תהליך המשלב באופן חסר תקדים טכנולוגיות דיגיטליות, פיזיות וביולוגיות, תוך טשטוש הגבולות בין העולם האנושי וזה הטכנולוגי?
"המהפכה התעשייתית הרביעית" (Fourth Industrial Revolution), או המהפכה התעשייתית 4.0, הם שמותיו של שינוי טכנולוגי עמוק ומהפכני בעידן המודרני. את המונח טבע פרופסור קלאוס שוורב (Klaus Schwab) מהפורום העולמי לכלכלה (World Economic Forum).
בניגוד למהפכות התעשייתיות הקודמות, המהפכה הרביעית מאופיינת בקצב חסר תקדים של התפתחות טכנולוגית וביכולת של טכנולוגיות לשנות מערכות שלמות, על ידי מרחב משולב בו פועלות, אלה לצד אלה ובתיאום מלא, מערכות פיזיות, דיגיטליות וביולוגיות.
זוהי מהפכה המשנה את האופן שבו אנו חיים, עובדים ומתקשרים. בעוד המהפכה התעשייתית הראשונה השתמשה באדי מים ובכוח הקיטור כדי להכניס את המכונות לתהליכי הייצור, המהפכה התעשייתית השנייה רתמה את החשמל כדי להגיע לייצור המוני, השלישית התמקדה בטכנולוגיית אלקטרוניקה, מחשוב ומידע במטרה לקדם אוטומציה בייצור - המהפכה התעשייתית הרביעית מתמקדת גם ביצירת בינה מלאכותית שיכולה ללמוד, להסתגל ולקבל החלטות באופן עצמאי.
במרכז הטכנולוגיות הללו שמניעות את המהפכה נמצאות טכנולוגיות ה-AI, האינטרנט של הדברים, רובוטיקה מתקדמת, הדפסת תלת-ממד, טכנולוגיות מחשוב ביולוגיות, מחשוב קוונטי וטכנולוגיות חישה מתקדמות. כל אלו יוצרים מרחב משולב שבו פועלות בסינכרוניזציה מלאה מגוון מערכות פיזיות, דיגיטליות וביולוגיות.
אין כמעט גבול להשפעות החברתיות והכלכליות של המהפכה הזו. מצד אחד היא יוצרת הזדמנויות עצומות לחדשנות וקידמה, אך בו בזמן היא גם מעוררת אתגרים הקשורים לשינויים בלתי נתפסים בתעסוקה ובעולם המקצועי שמרכיב את שוק העבודה, לשוויון בין עשירים לעניים, לפרטיות של אנשים ולזהות אנושית.
לצד העלייה בייצור, טיוב הפעילות, מקסום הערך עם הירידה בעלויות והאופטימיזציה של המדדים התפעוליים, כולל בטיחות העובדים ואיכות המוצר ובזמן שמקצועות חדשים כבר צומחים סביב הטכנולוגיות המתקדמות שצצות בכל יום, ברור שמקצועות רבים צפויים להשתנות או להיעלם לגמרי.
כיום יש כבר דיבור על מהפכה תעשייתית חמישית, שתתרכז בפרסונליזציה ובהתאמה של המערכות המתוחכמות, כולל הרובוטים והקובוטים התעשייתיים הללו, לצרכי המפעלים.
אז הסיפור של המהפכה התעשייתית הרביעית הוא ממש לא רק טכנולוגי, אלא הסיפור של החברה האנושית והדרך בה היא תבחר לעצב ולנווט את השינויים המהירים והמורכבים הללו, לצד השמירה על ערכיה האנושיים והאתיים.
הנה ארבע המהפכות:
https://youtu.be/Rd8gVeqE-qc
סקירה יפה על המהפכה התעשייתית הרביעית:
https://youtu.be/Ko2esJeGsrI
למה המהפכה הרביעית נוגעת לנו בעצם?
https://youtu.be/JKsVYpRp41w
הסבר מעמיק על מהפכת המאה ה-21 התעשייתית:
https://youtu.be/v9rZOa3CUC8
הרצאת וידאו על המהפכה המדהימה הזו:
https://youtu.be/GDlK9f7zHo4
סרטון תיעודי על המהפכה התעשייתית 4.0:
https://youtu.be/kpW9JcWxKq0?long=yes
ההשפעה על החיים והחברה (עברית):
https://youtu.be/6mlG1mfpDjg?long=yes
ויש מי שקורא לשלב הבא "המהפכה החמישית" או "המהפכה הרבודה" (מתורגם):
https://youtu.be/aR5N2Jl8k14?long=yes
מה זה UBI שישמור בעתיד על מובטלי ה-AI?
מדובר ברעיון מסעיר ויצירתי. הוא נקרא "הכנסה בסיסית אוניברסלית" (Universal Basic Income בקיצור UBI) ובעזרתו יש מי שמנסים לקדם את פני הרעה של הקדמה הבינתית, המאיימת על כל עולם התעסוקה של העתיד.
כוונתו להעמיד לרשות כל אדם הכנסה בסיסית, שמטרתה לסייע בהפחתת ההשפעות של הטכנולוגיה על העובדים. הכנסה בסיסית כזו תחושב על ידי "חישוב בסיסי אוניברסלי" ודי אחיד.
הרעיון הוא להציע הכנסה בסיסית אוניברסלית, מעין תשלום מזומן, ללא תנאים, שיינתן לכל מבוגרי האוכלוסייה, ללא קשר לעושרם ולמצבם התעסוקתי. המטרה היא לספק רשת ביטחון לאנשים שהמשרות והתעסוקה שלהם מאוימות על ידי חידושי הטכנולוגיה, כולל ובמיוחד הרובוטיקה והבינה המלאכותית.
הכוונה היא לאפשר להם לחפש עבודה בתחומים שמדברים אליהם ומעניינים אותם, בדברים שיסייעו להם לממש את עצמם והם יכולים להצליח בהם, לבלוט ולנצנץ - אולי אפילו ליזום עסק משלהם וליצור לעצמם בסיס כלכלי מבלי להיות שכירים, באיום מתמיד של אבטלה...
גם אם שמרנים רבים נוטים לדחות את מה שהם תופסים כרווחה שתקטין את המוטיבציה של אנשים לחפש עבודה ולעבוד, ניסיונות לחלק UBI לתושבי ערים ומדינות בארצות הברית הראו תוצאות חיוביות בדרך כלל. חלק מהתוכניות הללו, אגב, העניקו את התשלומים באופן סלקטיבי לאנשים, על סמך הצורך המוכח או המעמד החברתי שלהם ולא לכל האוכלוסייה כולה.
בין התומכים ביוזמה הזו ניתן למצוא גם רבים מראשי ומצליחני ההייטק, כולל מי שמובילים את התפוצצות ה-AI הנוכחית, ביניהם מנכ"ל חברת OpenAI והאדם הכי חזק בעולם הבינה המלאכותית כרגע, סם אלטמן.
לשיטתו, דווקא בשל החשש שהבינה המלאכותית תלך ותחליף אינספור עובדים אנושיים, כולל אנשים שלמדו מקצועות ורכשו תארים ומומחיות ויהפכו למובטלים, אולי אפילו מובטלים כרוניים, דווקא בצל החשש הזה כדאי לתת את ההכנסה הבסיסית המדוברת.
לשיטתו של אלטמן, כל אזרח יקבל, אולי במקום כסף, חלק ממחשב סופר-מתקדם, שהוא מכנה לצורך העניין GPT-7. כל מקבל כזה, אלטמן גורס, יכול יהיה לעשות כרצונו בחלק שקיבל. יהיו מי שישתמשו בו ויקימו מיזם, למשל טכנולוגי, או יהיו שותפים במיזם כזה, אחרים ירצו אולי למכור את החלק שלהם לאחרים, יהיו שיעדיפו לתרום אותו לטובת מחקר בפתרון בעיות עולמיות, כמו משבר האקלים או חקר הסרטן.
ההנחה של מנכ"ל OpenAI היא שעם הטמעתה של הבינה המלאכותית המתקדמת ביותר ויותר היבטים של חיינו, הבעלות על יחידה של מודל שפה גדול, כזה שהוא מכנה GPT7, עשויה להיות בעלת ערך גדול יותר מאשר כסף. אלטמן רואה עולם בו כל אדם בחברה העתידית יחזיק למעשה חלק מהקידמה והיצרנות העתידית ויוכלו להבטיח לעצמם ולמשפחתם פרנסה בעתיד.
הנה רעיון ההכנסה הבסיסית אוניברסלית (עברית):
https://youtu.be/8rM_-49DPe4
בטלנות? רוגע כלכלי? - על ניסוי ראשון איך זה ישפיע על בני אדם? (עברית)
https://youtu.be/u_-N_AWQQiI
בעלי מקצוע מפחדים על העבודה שלהם (עברית):
https://youtu.be/0AGYOv0sGHg
וסרטון מקיף על ה-UBI ומשמעויותיו (מתורגם):
https://youtu.be/kl39KHS07Xc?long=yes
מהם הסיכונים שבבינה מלאכותית?
בשנת 2017 ראו החוקרים במעבדת הבינה המלאכותית של פייסבוק את העתיד שממנו אנו חוששים. הם גילו ששתי תוכנות, שני בוטים של מחשב, פיתחו שפה עצמאית כדי לתקשר ביניהם בצורה יעילה מהשפה האנושית שבה תוכנתו לתקשר. החוקרים, שחששו מתקשורת ישירה ועצמאית בין תוכנות, ללא צורך בבני אדם ותוך אובדן השליטה האנושית בהן, ניתקו את התוכנות התבוניות לחלוטין.
זה היה פרק נוסף בתסריט האימים שהאנושות חוששת ממנו. מכונות שעובדות ביחד, באופן עצמאי לחלוטין.
בינה מלאכותית או אינטליגנציה מלאכותית היא ענף במדעי המחשב שמנסה להקנות למחשבים את היכולת לחשוב באופן שבו חושב המוח האנושי. הבינה האנושית היא שונה מזו של המחשב בדרך שבה היא מתרחשת, אבל היא הולכת ומתקדמת לחיקוי החשיבה האנושית.
ההגדרה הידועה ביותר לבינה מלאכותית ידועה בשם 'מבחן טיורינג' ולפיה מחשב ייחשב לבעל תבונה, אם אדם שינהל עמו שיחה, בדרך שאינה מסגירה אם זה מחשב או בן-אנוש, לא יוכל לזהות האם מולו ניצב אדם או מכונה. קראו על כך באאוריקה בתגית "מבחן טיורינג". רק בשנת 2014 עמדה לראשונה תוכנת מחשב במבחן טיורינג, כשהצליחה לעבור את סף 30% מהמשוחחים שחשבו שהם שוחחו עם בן-אדם.
אז בעידן שמחשבי-על עוברים את מבחן טיורינג, ניצחו רבי אמן בשחמט והידע שלהם טוב משל אלופי תכניות הידע בטלוויזיה, מצחיק להיזכר שהחוקר המפורסם מרווין מינסקי הגדיר את האינטליגנציה המלאכותית כיכולת של המפתחים "לגרום למכונה להתנהג בדרך שהייתה נחשבת לאינטליגנטית, לו אדם התנהג כך". מי יודע אם הוא שיער שהסכנות של מכונות בעלות יכולת למידה אנושית תתגלינה כה מהר.
רבים מאנשי המדע והטכנולוגיה מזהירים כיום שמתקרב תסריט האימים של רובוטים תבוניים המצוידים בבינה ונלחמים בבני האדם על השליטה בעולם. חוקרים מפורסמים כמו סטיבן הוקינג ואנשי טכנולוגיה מובילים כמו ביל גייטס ואיילון מאסק, טוענים שהיכולות המדהימות של המחשוב התבוני המתקרב מאיימות על המין האנושי. הוקינג אמר ש"מותר האדם על המכונה הוא ביכולת החשיבה האנושית ואם מכונות יצליחו לחשוב באופן מהיר וזול יותר מבני-אדם, לא יהיה בנו צורך יותר."
מאות מדענים ומובילים טכנולוגיים בעולם כבר חתמו על קריאה להדק את הפיקוח על פיתוחי הבינה המלאכותית. בין החותמים גם מנהלי הפרויקטים לפיתוחים מתקדמים בתחום הבינה המלאכותית בחברות כמו יבמ (חברת IBM שפיתחה את מחשב העל 'ווטסון'), גוגל ופייסבוק.
מי מודע יותר מהם לפוטנציאל ההתנגשות שבין האדם למכונה וליחסי הכוחות העתידיים בין השניים? - אז כשהם מצביעים על הסכנות שבדהירה המטורפת לפיתוחי הטכנולוגיה החישובית, לעומת ההתפתחות הקבועה והאיטית של החשיבה האנושית, כדאי לשים לב לכך.
בפברואר 2021 הכריז הפורום הכלכלי העולמי על השקת הברית העולמית לפעילות בינה מלאכותית (GAIA). ברית זו תקיים פיתוח הוגן של AI, תוך ניטרול של הסיכונים הנובעים ממערכות אינטליגנציה מלאכותית לא מוסריות או לא מאובטחות.
הנה סרטון על הבינה המלאכותית ויתרונותיה המטורפים אבל גם על הסכנות שבה (עברית):
https://youtu.be/cpWuS8A5Fxw
מעט על הבינה המלאכותית:
http://youtu.be/x-QfL_BmZVE
סופיה, הרובוטית האזרחית החכמה מדגימה מעט מהבלבול והסכנות שבאינטליגנציה המלאכותית:
https://youtu.be/78-1MlkxyqI
אזהרות המומחים מפני מצב שבו יימצא האדם מול מכונה:
http://youtu.be/CbNy67HrvOo
ורובוטים שמבוססים על בינה מלאכותית (עברית):
http://youtu.be/g0yEDyEppeM
מהי למידת מכונה או למידה חישובית? ומהם מדעני הדאטה?
למידת מכונה (Machine Learning), או למידה חישובית, היא היכולת של מערכת מחשב ללמוד ולהשתפר על ידי התבוננות ופעילות עצמאית שלה עם מידע.
זוהי לא בדיוק טכנולוגיה או כלי ספציפי, אלא תחום מחקרי מדעי, המשלב מרכיבים מעולמות הסטטיסטיקה ומדעי המחשב. באמצעותם מאפשרת למידת המכונה זיהוי אוטומטי של דפוסים מרתקים בכמויות נתונים גדולות.
#אבל איך מכונה לומדת?
ובכן, בואו נדמיין לרגע מצב דמיוני. דמיינו מיליוני תלמידים מטומטמים, שלומדים אצל מורה לא מוכשר במיוחד. כל פעם המורה הזה מראה להם משהו שהוא רוצה שיידעו (מראה להם למשל שתי תמונות ואומר מה מופיע בכל אחת) ואז בוחן אותם. חוץ מלתת ציון לתשובות שלהם, הוא תמיד מעיף מהכיתה שלו את אלו שלא זיהו ומשכפל את אלה שכן. אז מראה המורה עוד משהו ובוחן ושוב מעיף... הוא עושה את זה מיליוני פעמים... כן, דמיינו שהוא חוזר על התהליך הזה עם מיליוני תלמידים, שוב ושוב... קוראים לזה, אגב, "אִיטֵרַצְיות", פעולות שחוזרות על עצמן שוב ושוב במהלך פתרון של בעיה.
כך, בהדרגה ובאופן שלא תמיד מובן לנו, המכונות, סליחה - התלמידים המטומטמים, הולכים ומשתפרים. הם לומדים!
אז לאור הסיפור הזה, איך עושה זאת המחשב?
בצורה דומה אבל טכנולוגית, ככל שמחשב לומד מצויד ביותר נתונים והתנסויות, הוא נעשה חכם יותר. המידע שהוא מעבד מסייע לו לשפר כל הזמן ולגמרי בעצמו, את המודל החישובי שלו.
אנשי הלמידה החישובית מפתחים אלגוריתמים ודרכים שמאפשרים למחשב ללמוד בעצמו ולשפר את יכולותיו.
אם נסכם לרגע, אנשי למידת המכונה יוצרים מכונה המלמדת את עצמה התנהגויות ותובנות, על סמך מפגשים עם מצבים שונים וסיטואציות שמהם ניתן ללמוד ולהסיק מסקנות. המכונה הזו מתנהגת כמו בן-אנוש, שלומד ללא הפסקה, מהתנסויות וטעויות, אבל בהיקפים מטורפים ועם המון דאטה.
על ביג דאטה שמעתם? התחום הזה של מכונה לומדת הוא בדיוק הסיבה שענקי האינטרנט אוספים עלינו מידע בכמויות ענק. בעזרתן הם משפרים את האלגוריתמים והמכונות הלומדות שלהם ויוצרים להן ידע המשתבח והולך.
בלמידת מכונה מצויד המחשב באינטליגנציה מלאכותית ולומד מתוך דוגמאות והתנסויות קודמות שלו ולא בזכות מתכנת אנושי שמזין את הידע למחשב. כלומר, בלמידה כזו מתרחשת הלמידה על ידי המחשב מתוך דוגמאות ומקרים שקרו לו.
האלגוריתם של המחשב ממש מחקה את הדרך שבה פועלת הרשת העצבית שבמוח האנושי. באופן מסוים, מחשבים חכמים כבר הגיעו מזמן לביצועים שמזכירים את הלמידה של תינוקות על ידי חיקוי הוריהם. באופן אחר, הם כל כך משתפרים שיש כבר רבים שמתחילים לחשוש מזה...
המדענים מזהים למידת מכונה, כאשר הביצועים של משימה במחשב הולכים ומשתפרים עם הניסיון. כלומר, בכל פעם שתוכנת המחשב מבצעת משימה, באופן יעיל מאשר ביצעה אותה בעבר. ככל שתוכנה משיגה תוצאות טובות יותר, מבלי שמתכנת אנושי השפיע על הקוד שלה, אז התרחשה למידה חישובית, או למידת מכונה.
#מה עושים בלמידת מכונה?
לא חסרות מערכות שאנחנו פוגשים בהן ביום יום שלנו ומשתמשות בלמידת מכונה. למשל המלצות תוכן כמו שמקבלים מספוטיפיי שמציע לנו שירים שאנחנו עשויים לאהוב או סרטים מומלצים בנטפליקס. זיהוי דואר זבל ואזהרה, לעומת מיילים רגילים בג'ימייל. מערכת זיהוי פנים או טביעת אצבע בכניסה לטלפון, מערכות למניעת הונאה בכרטיסי אשראי ועוד.
מהי למידת מכונה (מתורגם):
https://youtu.be/f_uwKZIAeM0
איך מכונות לומדות? -הנה (מתורגם):
https://youtu.be/R9OHn5ZF4Uo
מאיפה מגיע המידע הנחוץ לאימון המכונה ומה חשוב באיסופו (מתורגם):
https://youtu.be/x2mRoFNm22g
המקור ההיסטורי של משין לרנינג ודרך פעולתה:
https://youtu.be/HBDp183HEic
עוד הסבר על למידת המכונה:
https://youtu.be/mJeNghZXtMo
אחד האתגרים בלמידת מכינה הוא ליצור למידה שאינה מוטית לכיוונים חברתיים ספציפיים:
https://youtu.be/59bMh59JQDo
הסבר קצר על הלמידה החישובית:
https://youtu.be/ty-kTUzMnjk
מחשב לומד שמתבונן בשחקנים המשחקים במשחקי מחשב ולומד לשחק ברמה מקצועית שיכולה להביס את הטובים שבהם:
https://youtu.be/EfGD2qveGdQ
תוכנה לומדת שמשחקת ומשתפרת כל הזמן במשחק מחשב:
https://youtu.be/qv6UVOQ0F44
רוצים לאמן מכונה ואפילו בלי תכנות? - הנה פעילות נחמדה וחכמה:
https://youtu.be/i9tjzr1KME0
מהם סוכני AI ומה הם עושים?
סוכני AI הם רכיבי תוכנה אוטונומיים, מבוססי AI, יישומים שנתמכים בבינה מלאכותית ומסוגלים לתפוס את סביבתם, לקבל החלטות ולנקוט פעולות להשגת מטרות ספציפיות עבורנו המשתמשים.
בשנת 2025 החלה תעשיית ה-AI במרוץ לפיתוח מה שנקראים בשפה הפופולרית "סוכנים חכמים" (AI agents), סוכני AI או LLM Agents.
אבל איך זה קורה?
סוכני AI הם עוזרים דיגיטליים בעלי יכולות לפתור בעיות. אלה לא מודלי שפה שעונים על כל השאלות האפשריות או מבצעים משימות מכל הסוגים, אבל באופן בינוני, אלא מנועי בינה ממוקדים, בעלי מומחיות ומצוידים ביכולות לשלב כלים שונים ואמצעים מגוונים בכדי להגיע לפתרונות ב"תחום מומחיותם", כלומר התחום שלשמו פותחו.
סוכני AI הם מנועי תוכנה מבוססי בינה מלאכותית שיכולים לבצע משימות באופן אוטונומי, כלומר עצמאי, בתהליך מעגלי ואיטרטיבי, כלומר עם תיקונים ושיפורים של כל שלב שלא השיג את מטרתו, עד להשגת התוצאה.
מטרתם של סוכני AI טובים היא לחקות את תהליכי התכנון והביצועים הכי טובים של בני אדם מוכשרים ומיומנים בתחומם ומעבר להם...
הבינה המלאכותית מאפשרת כיום לסוכן AI שכזה לבצע פעולות בעצמו. בניגוד לכלי GenAI שמתמקדים בדרך כלל ביצירה של תוכן כמו טקסט, תמונות, סרטונים ומוסיקה - הסוכנים החכמים, ה-AI Agents הללו, מיועדים לפתרון בעיות ממוקד ולביצוע של משימות מורכבות.
סוכן AI מבין שפה טבעית לחלוטין והתקשורת איתו פשוטה ורגילה ולא מחייבת מיומנות מיוחדת, מצידנו בני האדם.
סוכני ה-AI נקראים כך מכיוון שהם עושים את העבודה במקום המשתמש. הם יודעים לדמות התנהגות ויכולות אנושיות, אך בה בעת גם יכולות לא אנושיות. במילים אחרות, סוכני בינה כאלה ממירים את הידע של כיצד לעשות דברים ליכולת אמיתית לעשות אותם ולעשייה ממוקדת כזו, לפי צרכי המשתמש.
סוכנים בינתיים כאלו מאפשרים אוטומציות של פעולות מורכבות ותובעניות מבחינת זמן ובכך הם מביאים להחזר השקעה מהיר. לארגונים וחברות הם מאפשרים להגדיל את הצמיחה ולחסוך לטווח הארוך הרבה כסף. הם מחליפים ויחליפו בעתיד רופאים, מהנדסים, חוקרים ועוד בעלי מקצוע רבים.
סוכן ה-AI הוא המשך של הצ'טבוטים הוותיקים והעוזרים החכמים שעזרו לנו בעשור השני של המאה ה-21. הוא הופך את האינטליגנציה של הבינה המלאכותית לפעולה וליכולות ביצוע. הוא מבין את ההוראות שלך, מעבד את המידע הזה ומספקים את מה שביקשת - תשובה, פתרון, הסבר או עזרה בהשלמת משימה.
ברגע שהוא מוגדר היטב ומצויד בכלי ה-AI המתאימים, הסוכן החכם מטפל במשימות באופן מושכל ומדויק, מתכנן, מקבל החלטות ומבצע באופן אוטומטי פעולות מעייפות ושוחקות, לצד "עבודות שחורות". כך הוא משחרר את המשתמשים להתמקד בעניינים חשובים יותר.
כשהסוכנים החכמים הללו עובדים, כולנו מבינים שהמשימה תבוצע. בהתחייבות של AI. זו מהפכה שעומדת להיות מהפכה מטורפת ומובילי הטכנולוגיה חוזים שהאייג'נטים הללו, אותם סוכני AI, יהיו התוכנות החדשות, שהעולם יהיה מלא בהם.
אבל מיהם אותם סוכנים ומה בדיוק הם מאומנים ויכולים לעשות בשבילנו?
#מה זה סוכן AI?
אם AI באנגלית הוא ראשי התיבות של בינה מלאכותית, צריך להבין שבינה מלאכותית לכשעצמה היא מוח גולמי עם ים של פוטנציאל. אבל עד שלא נשאל אותה, עד שלא נבקש ממנה לעשות משהו ספציפי, ניתן לה תפקיד או משימה, היא לא תהיה ממש שימושית.
וזו בדיוק המשמעות של סוכן חכם, או סוכן AI. אם בינה מלאכותית היא גאון עם המון יכולת, אך סוג של "ראש קטן", סוכן AI הוא ביצועיסט, בינה מעשית שבאמת נותנת עבודה. יש לה יכולות מסוימות ומוגדרות והיא מתמחה בהן ורק בהן ואותן היא מבטיחה לבצע.
במילים פשוטות, האייג'נט עם ה-AI הוא עוזר וירטואלי חכם שמסוגל לבצע בעצמו משימות ספציפיות, תוך שימוש יעיל ביכולות הבינה המלאכותית. כמו ששעון מעורר יכול להעיר אותנו בבוקר, סוכני בינה ספציפיים כאלו יכולים לבדוק ולענות על המיילים שלנו, לקבוע לנו פגישות, לערוך קניות, למכור שירותים ומוצרים ללקוחות, לתכנן טיול או חופשה בחו"ל, חיפוש באינטרנט, הזמנת טיסות, למצוא לנו בדיחות לערב סטנדאפ בכיכובנו, או לנגן לנו מוסיקה לפי מצב הרוח שלנו.
כלומר, בזמן שבינה מלאכותית עניינה להיות חכמה נורא ולדעת הכל, הסוכן החכם עם ה-AI הוא הגרסה המעשית. הוא זה שמבצע משימות מוגדרות ומבצע אותן היטב. אפשר לדמות אותו למישהו מוכשר שמתגייס לצבא ואחרי שאומן לביצוע משימות מסוימות. הוא ממתין לפקודות שיקבל, או מבצע משימות לפי זמנים ותגובות, וכשהגיע הזמן לבצע את המשימה, או כשהוא מקבל פקודה לביצוע, הוא "עושה את מה שצריך" ומבצע וממלא את ההוראות.
#איך הם עושים זאת?
התשובה הכי קצרה היא: באמצעות ביצוע של משימות בצורה חכמה, עצמאית ויעילה.
סוכני AI מאומנים ומצוידים, כך שהם יידעו כיצד להגיב הכי טוב לדרישות, למצבים ולצרכים שונים. הם מבצעים את המבוקש מהם, לאחר שקיבלו הוראות מפורטות וגם נתונים שהם צריכים לקבל או לאתר.
סוכנים מצוידי AI נבנו כך שיהיו מסוגלים להבין דרישות, לחוש את המשתמש, לפרש נתונים, להבין את הסביבה, לקבל החלטות מושכלות ולבצע פעולות מורכבות יחסית - עד שיצליחו להשיג את המטרות שהוגדרו מראש.
כך מצליחים סוכני בינה מלאכותית כאלו להגביר את היעילות שלהם עבורנו, בני האדם. הם עושים זאת למשל, על ידי אוטומציה של משימות שגרתיות שמוטלות עלינו, מה שנקרא לא פעם "עבודה שחורה".
בכך מאפשרים הסוכנים הבינתיים הללו לעובדים האנושיים שאנחנו, להתרכז באסטרטגיה ויצירתיות.
מודלי השפה הרחבים (LLMs) שבהם הם מצוידים מאפשרים לאייג'נטים הללו לבצע משימות בצורה עצמאית ויעילה. עוד משולבים בהם מודלים מתקדמים לעיבוד שפה טבעית, מה שמאפשר להם להבין פרומפטים, הוראות, הנחיות וטקסטים בכתיבה טבעית. תוך יישום של טכניקות ניתוח מתקדמות כמו "העץ המחשבה" או "שרשרת המחשבה" (Chain of Thought) וביחד עם טכניקות ויכולות של למידת מכונה, הם יכולים להציע ביצועים מדהימים.
הסוכנים משפרים את הפרודוקטיביות, מפחיתים טעויות ומאפשרים שיתוף. חלקם ממלאים משימות מוגדרות מראש, אחרים עונים על שאלות, יש היכולים לתקשר בקול אנושי ולנהל שיחה רגילה. לעתים הם מתוכנתים לנהוג ולחשוב כאילו הם פקיד, מזכירה, מנהל חשבונות, מדענית, סוכן נסיעות או תחקירן - רבים מהם ספציפיים וממלאים משימה אחת היטב ואחרים ממלאים מגוון של משימות ואפילו בו-זמנית.
ההבנה היא שבאמצעות יכולת ניתוח של נתונים מורכבים ויכולת למידה מתמשכת הסוכנים החכמים הללו ימשיכו לפעול ולצבור ניסיון, תוך שהם הופכים ומתחדדים, לכלים נבונים ובעלי ביצועים טובים יותר ויותר.
#איך עובדים איתם?
אתם נכנסים לסוכן אינטליגנטי שאתם יודעים שמבצע משימה מסוימת ונותנים לו הוראות. מצידו, תהליך העבודה מתחיל בקבלת המטרה המוגדרת שנתתם לו. הוא מפתח במהירות הבזק תוכנית פעולה, בוחר את הכלים המתאימים לביצוע של המשימה שלא פעם הוא יפרק למשימות משנה וכאן מגיע ביצוע המשימות בפועל והערכה של התוצאות.
הכל מתבצע בצורה אוטונומית, מבלי להיעזר בכם. בדרך כלל הסוכן מסתמך על נתונים והקשרים שנאספו במהלך ה"שיחות" הקודמות שלכם ו"לומד אתכם" ומה הציפיות שלכם ממנו.
כי אחת התכונות החשובות של סוכני AI נעוצה ביכולת שלהם ללמוד ולהשתפר לאורך זמן. הם מנתחים כל הזמן את תגובותיכם והפעולות שלכם, לומדים מהמשוב שקיבלו מכם ומבצעים התאמות שישפרו את הביצועים שלהם. כך יכולים סוכני AI להתפתח ולהתאים את עצמם לצרכים המשתנים שלכם ולהגיב טוב ומדויק יותר למגוון רחב של צרכים וסיטואציות.
סוכן ה-AI מגיש לכם את התוצאות ואתם מוזמנים להמשיך ולנהל איתו דיאלוג. אפשר לבקש ממנו הרחבות ושיפורים. תוכלו גם להכניס שינויים בבקשה המקורית או עדכונים, להטיל עליו לבצע פעולות שישפרו את הדיוק למה שיתאים לצרכים שלכם וכך הלאה.
#דוגמאות?
האפשרויות כמעט אינסופיות. כבר היום יש סוכנים חכמים רבים. יש מהם שיכולים לבצע חישובים, לחפש באינטרנט, להבין תמונות, לנתח מסמכים מורכבים, לגשת למאגרי מידע ולהפעיל המון כלים נוספים.
יש סוכנים שנותנים תשובות על שאלות בתחומים שונים כמו משפטים או מיסים, אחרים בונים תכנית טיול שמותאמת לבקשותינו ולכלל המשתנים, יש שמזמינים כרטיסים להופעות או מקומות במסעדות, אחרים מנסחים טקסטים וכדומה.
בבית חכם יכול AI אג'נטי לשלוט בתאורה, בחימום ובאבטחה - על ידי שילוב עם מערכות אחרות, במטרה ליצור סביבת מגורים נוחה וקלה.
יש מהם שמבצעים אוטומציות שעושות בשבילך את העבודה, ממיינות את המיילים או מטפלות ב-To do list, כלומר ניהול המשימות האישי ועוד.
סוכני AI ייעודיים אחרים מפיקים טקסטים מותאמים אישית, למטרות כמו אימיילים, דו"חות, קורות חיים וחומרי שיווק. יכולותיהם מתגלות במיטבן כשהם מצליחים להתאים את רמת האוטונומיה שלהם, בהתאם לצרכים של המשתמשים ומטרותיהם.
הנה הסבר פשוט ולעניין של סוכני ה-AI:
https://youtu.be/wazHMMaiDEA
הבשלת היכולות של סוכנים חכמים מצוידי AI היא תוצאה של שנות התפתחות רבות:
https://youtu.be/WftLJZw6Cf8
צריך לתת סיכוי לסוכני AI חכמים (מתורגם):
https://youtu.be/xq8Ws1jyBX4
כך יוצרים סוכן AI בכלי שנקרא n8n:
https://youtu.be/6DLZK7XDOGo
סוכן AI לפיתוח כלי תוכנה ואפליקציות רשת:
https://youtu.be/aWBiZc5XKJM
הצ'טבוט המתקדם של Open AI שמשמש מתורגמן:
https://youtu.be/c2DFg53Zhvw
הכירו את ה-Projects של קלוד לבניית ושימוש בסוכני AI (עברית):
https://youtu.be/8mWR1r28ia4
הנה הסבר מקיף של סוכני ה-AI החדשים:
https://youtu.be/S9dc0y_Zesc?long=yes
סוכן ה-AI המתכנת המוביל:
https://youtu.be/Wvyc2E6OHm8?long=yes
והדגמת GPT 4o שהופך לסוכן AI ומסוגל לעשות פעולות שונות בשירותך:
https://youtu.be/DrKkKLEditU?long=yes
מה בין צ'אטבוט, LLM וסוכן AI שמבצע משימות?
צ'אטבוט (Chatbot) הוא סוג של סייען חכם וממוחשב, שניתן לשוחח איתו בהתכתבות צ'אט, או במקרה של צ'אטבוט מתקדם יותר גם שיחה מבוססת דיבור.
כמובן שהצ'אטבוט הוא מערכת מבוססת AI (בינה מלאכותית, או אינטליגנציה מלאכותית) שמייצרת שיחה מלאכותית עם המשתמש - מבלי שבצד השני נמצא אדם אמיתי.
בעשור השני של המאה ה-21 הצ'אטבוט הלך ותפס את מקומו ברשת ובאפליקציות שונות והפך לדרך חדשה לחלוטין להשתמש באינטרנט. לקוחות מצאו את עצמם מנהלים התכתבות בצ'אט או שיחה אוטומטיות עם בוט, שנתן מענה מותאם אישית ושיפר את עצמו עם הזמן.
הצ'טבוט הבטיח לספק שירות לאורך כל שעות היממה, 24/7. הוא סימן הפחתה של המון מהעומס של שירות הלקוחות האנושי, חסך זמן למתעניינים וללקוחות שביקשו שירות וחסך לעסקים הרבה כסף.
התגלה שבוט AI ממוקד ואיכותי מסוגל להציע תגובות מהירות ומדויקות, מה שהוביל לשיפור ניכר בחוויית הלקוח ולעלייה בשביעות הרצון, אף שהיו לקוחות שהתעקשו לשוחח עם בן אדם, שהיה עמוס עכשיו פחות ולכן גם זמין להם הרבה יותר.
היתרונות של הצ'טבוט בטיפול אישי במשתמש ובלקוח היו עצומים. שולבו בו טכנולוגיות פרסונליזציה מתקדמות שהלכו והתפתחו, תוך גיוס הבינה המלאכותית לצרכי השיווק, המכירות והתמיכה.
רבים חזו שצ'אטבוטים עשויים להחליף חלק ניכר מהשימוש באתרי שירותים שונים ולייתר אותם בעתיד, מה שהתממש אבל חלקית.
בזמנו החליטה פייסבוק להשתמש בצ'אטבוטים בתוך שירות המסרים שלה מסנג'ר. היא אפשרה למפתחים חיצוניים לפתח צ'אטבוטים שיתנו שירותים ומידע מאתרים אחרים. ההכרזה על פלטפורמת הצ'אט בוט של פייסבוק מסנג'ר קדמה את רעיון הצ'אטבוטים המקוונים באופן משמעותי, במיוחד למשתמש הנייד בסמארטפונים ושעונים חכמים, אם כי הזינוק הטרנדי שנוצר עם ההשקה הלך ונרגע עם הזמן.
ההבשלה של אותם צ'אטבוטים באה בעשור הבא דווקא. זה קרה עם הגעתו של ChatGPT, מודל השפה הגדול הראשון (LLM), שאחריו הגיעו נוספים, כמו Gemini או Claude. מודל השפה הזה הוא בעיקרון מנוע בינה מלאכותית גדול ורחב-אופקים, המצויד ביכולת להבין שפה טבעית, אנושית, ויכול לעשות המון דברים, כלומר להתמודד עם מגוון ענקי של משימות ושהיכולות שלו הולכות וגדלות מיום ליום. ראו בתגית "LLM".
ממודלי השפה הגדולים התפתחו גם מנועי היצירה של הבינה הג'נרטיבית (Generative AI), המייצרים תמונות, שירים, וידאו ועוד. הכירו בתגית "GenAI".
אחריו נולדו סוכני ה-AI, צ'אטבוטים שממלאים משימות עבורך, על ידי שילוב בין היכולת הבינתית של מודל השפה הגדול כמו ChatGPT, עם היכולת של רכיב תוכנה שיכול לפעול באופן עצמאי וממוקד, למילוי של משימה ספציפית עבורנו, כמו לתכנן טיול, לקנות מוצרים אונליין, לטפל בדואר האלקטרוני שלנו וכדומה.
אותם סוכני AI הם רכיבי תוכנה אוטונומיים, יישומים מבוססי בינה מלאכותית, המסוגלים לתפוס את סביבתם, לקבל החלטות ולפעול לביצוע או השגת מטרות ממוקדות בשירות המשתמש. הכירו אותם בתגית "סוכני AI".
כלומר, אם הצ'טבוט של העשור שהחל ב-2010 היה עובד חרוץ אך לא חכם מדי, הצ'טבוט הבינתי של מודל השפה הגדול בעשור שאחריו רכש השכלה ופיתח את יכולותיו האינטליגנטיות באופן שהפך אותו למומחה ואז מגיע הסוכן הבינתי, AI agent והוא כבר עובד שמתמחה במשימה מסוימת ועושה אותה בצורה מיומנת וחרוצה.
עסקה טובה לרובנו.
פעילות נחמדה
============
בקישורים שלמטה יש לינק לצ'ט בוט נהדר. נסו לשוחח איתה (באנגלית) ולהכיר קצת את חוויית השיחה עם צ'ט בוט אופייני.
הנה עולם הצ'אטבוט:
http://youtu.be/iE9LtfQAYYU
עוד על השימוש בצ'אטבוטים ברשת:
http://youtu.be/G8z--x5tFOI
ההכרזה על הצ'אט בוט במסנג'ר של פייסבוק:
http://youtu.be/EOYnFUJyOlQ
ומנגד - כשהושק הצ'אטבוט של מיקרוסופט הוא "הסתבך" עם ביטויי גזענות קשים:
http://youtu.be/LA49GBcbudg
מהי בינה מלאכותית או אינטליגנציה מלאכותית?
הגדרה פשוטה של האינטליגנציה המלאכותית או הבינה המלאכותית (Artificial Intelligence) היא: כל דבר שמחקה את האינטליגנציה שלנו כבני אדם באמצעות מחשבים.
בינה מלאכותית היא תוכנה או מכונה שיכולה לפתור בעיות שאדם יכול לפתור. בניגוד למחשבים של פעם, שהיו מסוגלים להתמודד עם בעיות חישוביות, אך לא לחשוב, מערכת כזו מסוגלת לחקות חשיבה של ממש, כולל חשיבה מופשטת (על מושגים), דמיון, הסקת מסקנות לוגיות, ראייה, הבנת שפה טבעית, דיבור, הבנת העולם והכי חשוב, למידה.
מערכת כזו יכולה לא פעם ללמוד ולהתפתח מבחינת יכולותיה, ממש כמו שאנו לומדים כל הזמן וכך נעשים חכמים יותר. כך תלמד ותפעל המערכת על פי הבנתה ואז היא תהיה "מכונה לומדת". תחום למידת המכונה מתמחה ברעיון הזה, של פיתוחי מערכות לומדות ואימון שלהם, כמו שהורה או מורה מאמן ילד שגדל. קראו על כך בתגית "למידת מכונה".
יש גם תחום של "למידה עמוקה", בו המכונה "לא צריכה" אנשים שילמדו ויאמנו אותה, אלא לומדת, מסיקה מסקנות ומפתחת יכולות בעצמה. הרחיבו על כך בתגית "למידה עמוקה".
באופן כללי, בינה מלאכותית יכולה לחשוב. שימוש במידע שנאסף מבחוץ (בעזרת החושים) וזה שבפנים (ממאגרי הזיכרון והידע שצברנו בעבר) מאפשר את החשיבה הזו. לחשוב פירושו להשתמש במידע הזה ולארגן אותו מחדש ובכך ליצור מידע חדש. המידע שנוצר הוא הלמידה שלנו, ההמצאות שלנו, היצירות האמנותיות, ההומור וכדומה.
המבחן למערכת שיש בה בינה מלאכותית הוא "מבחן טיורינג". על פי מבחן זה, רק תוכנה אחת הצליחה עד היום להצטייר כבעלת תבונה ברמה שכזו (ראו באאוריקה בתגית "מבחן טיורינג").
הנה הסבר קצר ומהיר על הבינה המלאכותית:
https://youtu.be/acnIX2b2lpY?t=11s
דברים שמייצר ה-AI וכיצד הוא התפתח כל כך:
https://youtu.be/XtlC-rCjUyM
לאט ופשוט על הבינה המלאכותית:
https://youtu.be/hE74j-nD-q8
העולם של האינטליגנציה המלאכותית (עברית):
https://youtu.be/xcOw84E93MI
כך ה-AI ישנה ומשנה את העולם (מתורגם):
https://youtu.be/RzkD_rTEBYs
על רובוטים ומערכות תיב"ם (תכנון באמצעות מחשב), שמשתמשים בבינה מלאכותית (עברית):
https://youtu.be/g0yEDyEppeM
רובוט יצירתי שיכול להמציא בעצמו ולא רק לחזור על דברים שהוכנסו לתוכו:
https://youtu.be/-U-lQYwzFAQ
קבלו את iCub שיכול להבחין בדברים שתינוק יכול לדעת:
https://youtu.be/2oJSJa6P_EI
מה שאומר שיצירתיות היא חלק מהבינה המלאכותית (מתורגם):
https://youtu.be/Rh9vBczqMk0
הרצאת טד על הבינה המלאכותית שתשחרר אותנו מעבודה שחורה ולא יעילה (מתורגם):
https://youtu.be/ajGgd9Ld-Wc?long=yes
וסרטון תיעודי על האינטליגנציה המלאכותית:
https://youtu.be/53K1dMyslJg?long=yes
מה זה NLP או עיבוד שפה טבעית ב-AI?
עיבוד שפה טבעית, או NLP, משתמש במחשבים ובטכנולוגיות של בינה מלאכותית, המתמקדות בפיתוח אלגוריתמים המאפשרים למחשבים לקרוא, להבין ולתקשר בשפה רגילה, כתובה או מדוברת אבל טבעית, שפה של בני אדם.
NLP הם ראשי תיבות של "Natural Language Processing" ובעברית "עיבוד שפה טבעית". זהו תת-תחום בבינה מלאכותית, הקשור בצד הבלשני שלה, צד השפה המדוברת.
ניתן לומר בפשטות שהמטרה של עיבוד שפה טבעית היא שמחשבים יוכלו לתקשר עם בני אדם באותו אופן בו אנו, בני האדם, מתקשרים בינינו.
עיבוד השפה הטבעית קשור לתחום הבלשנות החישובית והוא משלב רעיונות מתחום מדעי המחשב בחקר השפה האנושית. התחום הזה במחשוב עוסק בבעיות הקשורות לעיבוד, טיפול ושינויים או מניפולציה של השפה הטבעית האנושית.
מטרת ה-NLP היא להבין שפות אנושיות, לנתח את התוכן והכוונה של המסרים שבהן ולהצליח לפרש את משמעותם הבסיסית, כך שניתן יהיה לגרום למחשבים "להבין" דברים שנכתבים או נאמרים בשפה הטבעית, כלומר בשפות של בני-אדם.
לשם כך, מודלים של NLP משתמשים בנוסחאות או בעצם אלגוריתמים של למידת מכונה, יחד עם שילוב כללים מוגדרים מראש.
בשנים האחרונות זוכה התחום לעניין רב, כחלק מהפיתוח של יישומי מחשב, רובם מבוססי בינה מלאכותית, יישומים שהתקשורת עימם היא בשפה אנושית.
רבים מהכלים הללו מחייבים תיאורים מילוליים של התוצר המצופה מהם, מנהלים שיחה עם המשתמש או מטפלים בטקסטים באופנים שונים. חלקם מייצרים ויוצרים יצירות באופן דומה ליצירה אנושית, מה שמחייב הנחיות, פרומפטים המהווים תיאור טקסטואלי של תוכן ואופי התוצרים המצופים, כמו תמונות, סרטים, מוסיקה, קוד ועוד.
עיבוד השפה הטבעית קשור לתחום הבלשנות החישובית והוא משלב רעיונות מתחום מדעי המחשב בחקר השפה האנושית.
הנה הסבר פשוט של NLP במדעי המחשב:
https://youtu.be/pqgUfv7UP4A
היישומים המדהימים של עיבוד שפה טבעית לתקשורת בינינו ובין מערכות AI:
https://youtu.be/TZMZvULBVio
זה עיבוד שפה טבעית בלמידת מכונה:
https://youtu.be/CMrHM8a3hqw
מטרת ה-NLP בעולם של ימינו:
https://youtu.be/7NObIGHhQWA
עיבוד השפה הטבעית בטכנולוגיות AI יומיומיות:
https://youtu.be/43cXcuXGnXk
אי אפשר לדבר על NLP בלי לדבר על LLM (עברית):
https://youtu.be/ugxgxqRg2-I
פרמטרים וטוקנים הם לא הכל במודלים:
https://youtu.be/a1nqXQMOCks
מהם טוקנים ב-AI ולמידת מכונה?
מאסימוני הטלפונים ועד עולם אבטחת מערכות מחשוב, טוקן (Token), בעברית “אסימון”, הוא מושג המשתנה בהתאם להקשר שבו הוא מוזכר. אפילו בתוך עולם המחשבים יש למושג טוקן כמה שימושים.
בלמידת מכונה, אחת הזירות המרתקות של העידן המודרני והתחום בו פועלים מודלי השפה הפופולריים של ימינו, כמו Claude או ChatGPT, לטוקנים יש משמעות אדירה.
אותם מודלים גדולים, LLMs, הם מודלים מתמטיים. כדי לבצע את המשימות שאנו מבקשים מהם, תוך כדי תקשורת איתם בשפה טבעית, כמו אנגלית, עברית וכדומה, הם משתמשים בתהליך שנקרא "טוקניזציה" (Tokenization).
במרכז הטוקניזציה נעשה פילוח של הטקסטים שהמודלים הללו מקבלים כנתונים, כדאטה, ליחידות קטנות יותר, תרגום של חלקי המידע הקטנים למספרים, כשאת יחידות המידע הללו, שהומרו למספרים, הם ינתחו בהמשך.
כך, אחרי שמסתיימת הטוקניזציה, הם מייצרים מהמידע טוקנים, מספרים שכל אחד מהם מייצג פריט מידע קטן. ה"טוקן" משמש בהם בתפקיד "אסימון למידת המכונה", שמתאר באופן מתמטי את יחידות הטקסט הקטנות. אלה מעין יחידות מידה שהמודלים המוכרים יוצרים מהקונטקסט.
לאחר שסיימו להפוך את המידע לטוקנים, מרבית המודלים שאנו מכירים הטוקנים משמשים לייצוג של הטקסט, ביחידות קטנות שהמודל מעבד בצורה מתמטית.
כשאנו משתמשים בטוקנים, זה כדי לסייע למודל להבין את המבנה של הטקסט, כך שיוכל לבצע על פיו את החישובים שלו. טוקן אחד יכול להיות כל חלק ממילה בשפה הרגילה שלנו, או אפילו תו אחד.
כדי להבין ולהגיב לקלט, המודל משתמש בכמות מסוימת של טוקנים. וטוקן יכול להיות כל פיסת מידע, מתו בודד ועד מילה שלמה ולעתים גם יותר. יש שיטות שונות של טוקניזציה והבחירה ביניהן היא בהתאם לאלגוריתם בו משתמשים. יש שהאסימון הוא לפי תווים (Character tokenization), אסימון לפי מילים, לפי משפט, ביטויים, טוקניזציה לפי מילת משנה ולפי מספר.
בשיחה על מודל AI (ה-LLM, כמו ChatGPT או Claude) משמש הטוקן לציון גודל השיחה על המודל והיקף המידע שיכול להיות בה. לכל מודל יש מגבלה של זיכרון התוכן שהוא יכול לעבד בשיחה אחת ולהתבסס עליו בתשובות שלו ובמהלך השיחה.
כל הטקסט שהמודל מכיל ובא מהקלט שמזרים לו המשתמש, כולל השאלות והתשובות וכל מידע נוסף, כל אלו מכונים "קונטקסט" (Context), כלומר "ההקשר".
חלון ההקשר (Context window), או "חלון הקונטקסט", מייצג את כמות התוכן שהמודל יכול לעבד בשיחה עם משתמש. הכמות הזו נספרת בטוקנים. אם קלוד, למשל, תומך ב-200 אלף טוקנים, זה אומר שהשיחה יכולה לכלול כ-40 אלף מילים. אם לג'מיני של גוגל יש מיליון טוקנים, זה אומר פי 5 יותר מילים וגודל חלון הקונטקסט שלה, כלומר השיחות עם ג'מיני הוא של כ-2 ספרים ממוצעים.
גם מהירויות של מודלים מודגמת לא פעם בטוקנים לשנייה. לא נדיר לראות השוואת מהירויות כמו "מודל ה-Sonar החדש של Perplexity מגיע לביצועים של עד 1200 טוקנים לשניה, בהשוואה ל-75 טוקנים לשניה בלבד של המודל Claude 3.5 Sonnet" או 140 טוקנים לשניה של Gemini 2.0 Flash של גוגל".
טוקניזציה כפי שהיא נעשית בידי מדעני נתונים:
https://youtu.be/fNxaJsNG3-s
פרמטרים וטוקנים הם לא הכל במודלים:
https://youtu.be/a1nqXQMOCks
הסבר של Machine Learning Token באנגלית:
https://youtu.be/mnqXgojQCJI
וטוקניזציה באתרי אינטרנט שיכולה לשמש בהקשר אחר כאמצעי אבטחה:
https://youtu.be/Y7I4IDojhJk

שמתם לב שאנו נמצאים בליבו של תהליך המשלב באופן חסר תקדים טכנולוגיות דיגיטליות, פיזיות וביולוגיות, תוך טשטוש הגבולות בין העולם האנושי וזה הטכנולוגי?
"המהפכה התעשייתית הרביעית" (Fourth Industrial Revolution), או המהפכה התעשייתית 4.0, הם שמותיו של שינוי טכנולוגי עמוק ומהפכני בעידן המודרני. את המונח טבע פרופסור קלאוס שוורב (Klaus Schwab) מהפורום העולמי לכלכלה (World Economic Forum).
בניגוד למהפכות התעשייתיות הקודמות, המהפכה הרביעית מאופיינת בקצב חסר תקדים של התפתחות טכנולוגית וביכולת של טכנולוגיות לשנות מערכות שלמות, על ידי מרחב משולב בו פועלות, אלה לצד אלה ובתיאום מלא, מערכות פיזיות, דיגיטליות וביולוגיות.
זוהי מהפכה המשנה את האופן שבו אנו חיים, עובדים ומתקשרים. בעוד המהפכה התעשייתית הראשונה השתמשה באדי מים ובכוח הקיטור כדי להכניס את המכונות לתהליכי הייצור, המהפכה התעשייתית השנייה רתמה את החשמל כדי להגיע לייצור המוני, השלישית התמקדה בטכנולוגיית אלקטרוניקה, מחשוב ומידע במטרה לקדם אוטומציה בייצור - המהפכה התעשייתית הרביעית מתמקדת גם ביצירת בינה מלאכותית שיכולה ללמוד, להסתגל ולקבל החלטות באופן עצמאי.
במרכז הטכנולוגיות הללו שמניעות את המהפכה נמצאות טכנולוגיות ה-AI, האינטרנט של הדברים, רובוטיקה מתקדמת, הדפסת תלת-ממד, טכנולוגיות מחשוב ביולוגיות, מחשוב קוונטי וטכנולוגיות חישה מתקדמות. כל אלו יוצרים מרחב משולב שבו פועלות בסינכרוניזציה מלאה מגוון מערכות פיזיות, דיגיטליות וביולוגיות.
אין כמעט גבול להשפעות החברתיות והכלכליות של המהפכה הזו. מצד אחד היא יוצרת הזדמנויות עצומות לחדשנות וקידמה, אך בו בזמן היא גם מעוררת אתגרים הקשורים לשינויים בלתי נתפסים בתעסוקה ובעולם המקצועי שמרכיב את שוק העבודה, לשוויון בין עשירים לעניים, לפרטיות של אנשים ולזהות אנושית.
לצד העלייה בייצור, טיוב הפעילות, מקסום הערך עם הירידה בעלויות והאופטימיזציה של המדדים התפעוליים, כולל בטיחות העובדים ואיכות המוצר ובזמן שמקצועות חדשים כבר צומחים סביב הטכנולוגיות המתקדמות שצצות בכל יום, ברור שמקצועות רבים צפויים להשתנות או להיעלם לגמרי.
כיום יש כבר דיבור על מהפכה תעשייתית חמישית, שתתרכז בפרסונליזציה ובהתאמה של המערכות המתוחכמות, כולל הרובוטים והקובוטים התעשייתיים הללו, לצרכי המפעלים.
אז הסיפור של המהפכה התעשייתית הרביעית הוא ממש לא רק טכנולוגי, אלא הסיפור של החברה האנושית והדרך בה היא תבחר לעצב ולנווט את השינויים המהירים והמורכבים הללו, לצד השמירה על ערכיה האנושיים והאתיים.
הנה ארבע המהפכות:
https://youtu.be/Rd8gVeqE-qc
סקירה יפה על המהפכה התעשייתית הרביעית:
https://youtu.be/Ko2esJeGsrI
למה המהפכה הרביעית נוגעת לנו בעצם?
https://youtu.be/JKsVYpRp41w
הסבר מעמיק על מהפכת המאה ה-21 התעשייתית:
https://youtu.be/v9rZOa3CUC8
הרצאת וידאו על המהפכה המדהימה הזו:
https://youtu.be/GDlK9f7zHo4
סרטון תיעודי על המהפכה התעשייתית 4.0:
https://youtu.be/kpW9JcWxKq0?long=yes
ההשפעה על החיים והחברה (עברית):
https://youtu.be/6mlG1mfpDjg?long=yes
ויש מי שקורא לשלב הבא "המהפכה החמישית" או "המהפכה הרבודה" (מתורגם):
https://youtu.be/aR5N2Jl8k14?long=yes

מדובר ברעיון מסעיר ויצירתי. הוא נקרא "הכנסה בסיסית אוניברסלית" (Universal Basic Income בקיצור UBI) ובעזרתו יש מי שמנסים לקדם את פני הרעה של הקדמה הבינתית, המאיימת על כל עולם התעסוקה של העתיד.
כוונתו להעמיד לרשות כל אדם הכנסה בסיסית, שמטרתה לסייע בהפחתת ההשפעות של הטכנולוגיה על העובדים. הכנסה בסיסית כזו תחושב על ידי "חישוב בסיסי אוניברסלי" ודי אחיד.
הרעיון הוא להציע הכנסה בסיסית אוניברסלית, מעין תשלום מזומן, ללא תנאים, שיינתן לכל מבוגרי האוכלוסייה, ללא קשר לעושרם ולמצבם התעסוקתי. המטרה היא לספק רשת ביטחון לאנשים שהמשרות והתעסוקה שלהם מאוימות על ידי חידושי הטכנולוגיה, כולל ובמיוחד הרובוטיקה והבינה המלאכותית.
הכוונה היא לאפשר להם לחפש עבודה בתחומים שמדברים אליהם ומעניינים אותם, בדברים שיסייעו להם לממש את עצמם והם יכולים להצליח בהם, לבלוט ולנצנץ - אולי אפילו ליזום עסק משלהם וליצור לעצמם בסיס כלכלי מבלי להיות שכירים, באיום מתמיד של אבטלה...
גם אם שמרנים רבים נוטים לדחות את מה שהם תופסים כרווחה שתקטין את המוטיבציה של אנשים לחפש עבודה ולעבוד, ניסיונות לחלק UBI לתושבי ערים ומדינות בארצות הברית הראו תוצאות חיוביות בדרך כלל. חלק מהתוכניות הללו, אגב, העניקו את התשלומים באופן סלקטיבי לאנשים, על סמך הצורך המוכח או המעמד החברתי שלהם ולא לכל האוכלוסייה כולה.
בין התומכים ביוזמה הזו ניתן למצוא גם רבים מראשי ומצליחני ההייטק, כולל מי שמובילים את התפוצצות ה-AI הנוכחית, ביניהם מנכ"ל חברת OpenAI והאדם הכי חזק בעולם הבינה המלאכותית כרגע, סם אלטמן.
לשיטתו, דווקא בשל החשש שהבינה המלאכותית תלך ותחליף אינספור עובדים אנושיים, כולל אנשים שלמדו מקצועות ורכשו תארים ומומחיות ויהפכו למובטלים, אולי אפילו מובטלים כרוניים, דווקא בצל החשש הזה כדאי לתת את ההכנסה הבסיסית המדוברת.
לשיטתו של אלטמן, כל אזרח יקבל, אולי במקום כסף, חלק ממחשב סופר-מתקדם, שהוא מכנה לצורך העניין GPT-7. כל מקבל כזה, אלטמן גורס, יכול יהיה לעשות כרצונו בחלק שקיבל. יהיו מי שישתמשו בו ויקימו מיזם, למשל טכנולוגי, או יהיו שותפים במיזם כזה, אחרים ירצו אולי למכור את החלק שלהם לאחרים, יהיו שיעדיפו לתרום אותו לטובת מחקר בפתרון בעיות עולמיות, כמו משבר האקלים או חקר הסרטן.
ההנחה של מנכ"ל OpenAI היא שעם הטמעתה של הבינה המלאכותית המתקדמת ביותר ויותר היבטים של חיינו, הבעלות על יחידה של מודל שפה גדול, כזה שהוא מכנה GPT7, עשויה להיות בעלת ערך גדול יותר מאשר כסף. אלטמן רואה עולם בו כל אדם בחברה העתידית יחזיק למעשה חלק מהקידמה והיצרנות העתידית ויוכלו להבטיח לעצמם ולמשפחתם פרנסה בעתיד.
הנה רעיון ההכנסה הבסיסית אוניברסלית (עברית):
https://youtu.be/8rM_-49DPe4
בטלנות? רוגע כלכלי? - על ניסוי ראשון איך זה ישפיע על בני אדם? (עברית)
https://youtu.be/u_-N_AWQQiI
בעלי מקצוע מפחדים על העבודה שלהם (עברית):
https://youtu.be/0AGYOv0sGHg
וסרטון מקיף על ה-UBI ומשמעויותיו (מתורגם):
https://youtu.be/kl39KHS07Xc?long=yes

בשנת 2017 ראו החוקרים במעבדת הבינה המלאכותית של פייסבוק את העתיד שממנו אנו חוששים. הם גילו ששתי תוכנות, שני בוטים של מחשב, פיתחו שפה עצמאית כדי לתקשר ביניהם בצורה יעילה מהשפה האנושית שבה תוכנתו לתקשר. החוקרים, שחששו מתקשורת ישירה ועצמאית בין תוכנות, ללא צורך בבני אדם ותוך אובדן השליטה האנושית בהן, ניתקו את התוכנות התבוניות לחלוטין.
זה היה פרק נוסף בתסריט האימים שהאנושות חוששת ממנו. מכונות שעובדות ביחד, באופן עצמאי לחלוטין.
בינה מלאכותית או אינטליגנציה מלאכותית היא ענף במדעי המחשב שמנסה להקנות למחשבים את היכולת לחשוב באופן שבו חושב המוח האנושי. הבינה האנושית היא שונה מזו של המחשב בדרך שבה היא מתרחשת, אבל היא הולכת ומתקדמת לחיקוי החשיבה האנושית.
ההגדרה הידועה ביותר לבינה מלאכותית ידועה בשם 'מבחן טיורינג' ולפיה מחשב ייחשב לבעל תבונה, אם אדם שינהל עמו שיחה, בדרך שאינה מסגירה אם זה מחשב או בן-אנוש, לא יוכל לזהות האם מולו ניצב אדם או מכונה. קראו על כך באאוריקה בתגית "מבחן טיורינג". רק בשנת 2014 עמדה לראשונה תוכנת מחשב במבחן טיורינג, כשהצליחה לעבור את סף 30% מהמשוחחים שחשבו שהם שוחחו עם בן-אדם.
אז בעידן שמחשבי-על עוברים את מבחן טיורינג, ניצחו רבי אמן בשחמט והידע שלהם טוב משל אלופי תכניות הידע בטלוויזיה, מצחיק להיזכר שהחוקר המפורסם מרווין מינסקי הגדיר את האינטליגנציה המלאכותית כיכולת של המפתחים "לגרום למכונה להתנהג בדרך שהייתה נחשבת לאינטליגנטית, לו אדם התנהג כך". מי יודע אם הוא שיער שהסכנות של מכונות בעלות יכולת למידה אנושית תתגלינה כה מהר.
רבים מאנשי המדע והטכנולוגיה מזהירים כיום שמתקרב תסריט האימים של רובוטים תבוניים המצוידים בבינה ונלחמים בבני האדם על השליטה בעולם. חוקרים מפורסמים כמו סטיבן הוקינג ואנשי טכנולוגיה מובילים כמו ביל גייטס ואיילון מאסק, טוענים שהיכולות המדהימות של המחשוב התבוני המתקרב מאיימות על המין האנושי. הוקינג אמר ש"מותר האדם על המכונה הוא ביכולת החשיבה האנושית ואם מכונות יצליחו לחשוב באופן מהיר וזול יותר מבני-אדם, לא יהיה בנו צורך יותר."
מאות מדענים ומובילים טכנולוגיים בעולם כבר חתמו על קריאה להדק את הפיקוח על פיתוחי הבינה המלאכותית. בין החותמים גם מנהלי הפרויקטים לפיתוחים מתקדמים בתחום הבינה המלאכותית בחברות כמו יבמ (חברת IBM שפיתחה את מחשב העל 'ווטסון'), גוגל ופייסבוק.
מי מודע יותר מהם לפוטנציאל ההתנגשות שבין האדם למכונה וליחסי הכוחות העתידיים בין השניים? - אז כשהם מצביעים על הסכנות שבדהירה המטורפת לפיתוחי הטכנולוגיה החישובית, לעומת ההתפתחות הקבועה והאיטית של החשיבה האנושית, כדאי לשים לב לכך.
בפברואר 2021 הכריז הפורום הכלכלי העולמי על השקת הברית העולמית לפעילות בינה מלאכותית (GAIA). ברית זו תקיים פיתוח הוגן של AI, תוך ניטרול של הסיכונים הנובעים ממערכות אינטליגנציה מלאכותית לא מוסריות או לא מאובטחות.
הנה סרטון על הבינה המלאכותית ויתרונותיה המטורפים אבל גם על הסכנות שבה (עברית):
https://youtu.be/cpWuS8A5Fxw
מעט על הבינה המלאכותית:
http://youtu.be/x-QfL_BmZVE
סופיה, הרובוטית האזרחית החכמה מדגימה מעט מהבלבול והסכנות שבאינטליגנציה המלאכותית:
https://youtu.be/78-1MlkxyqI
אזהרות המומחים מפני מצב שבו יימצא האדם מול מכונה:
http://youtu.be/CbNy67HrvOo
ורובוטים שמבוססים על בינה מלאכותית (עברית):
http://youtu.be/g0yEDyEppeM

למידת מכונה (Machine Learning), או למידה חישובית, היא היכולת של מערכת מחשב ללמוד ולהשתפר על ידי התבוננות ופעילות עצמאית שלה עם מידע.
זוהי לא בדיוק טכנולוגיה או כלי ספציפי, אלא תחום מחקרי מדעי, המשלב מרכיבים מעולמות הסטטיסטיקה ומדעי המחשב. באמצעותם מאפשרת למידת המכונה זיהוי אוטומטי של דפוסים מרתקים בכמויות נתונים גדולות.
#אבל איך מכונה לומדת?
ובכן, בואו נדמיין לרגע מצב דמיוני. דמיינו מיליוני תלמידים מטומטמים, שלומדים אצל מורה לא מוכשר במיוחד. כל פעם המורה הזה מראה להם משהו שהוא רוצה שיידעו (מראה להם למשל שתי תמונות ואומר מה מופיע בכל אחת) ואז בוחן אותם. חוץ מלתת ציון לתשובות שלהם, הוא תמיד מעיף מהכיתה שלו את אלו שלא זיהו ומשכפל את אלה שכן. אז מראה המורה עוד משהו ובוחן ושוב מעיף... הוא עושה את זה מיליוני פעמים... כן, דמיינו שהוא חוזר על התהליך הזה עם מיליוני תלמידים, שוב ושוב... קוראים לזה, אגב, "אִיטֵרַצְיות", פעולות שחוזרות על עצמן שוב ושוב במהלך פתרון של בעיה.
כך, בהדרגה ובאופן שלא תמיד מובן לנו, המכונות, סליחה - התלמידים המטומטמים, הולכים ומשתפרים. הם לומדים!
אז לאור הסיפור הזה, איך עושה זאת המחשב?
בצורה דומה אבל טכנולוגית, ככל שמחשב לומד מצויד ביותר נתונים והתנסויות, הוא נעשה חכם יותר. המידע שהוא מעבד מסייע לו לשפר כל הזמן ולגמרי בעצמו, את המודל החישובי שלו.
אנשי הלמידה החישובית מפתחים אלגוריתמים ודרכים שמאפשרים למחשב ללמוד בעצמו ולשפר את יכולותיו.
אם נסכם לרגע, אנשי למידת המכונה יוצרים מכונה המלמדת את עצמה התנהגויות ותובנות, על סמך מפגשים עם מצבים שונים וסיטואציות שמהם ניתן ללמוד ולהסיק מסקנות. המכונה הזו מתנהגת כמו בן-אנוש, שלומד ללא הפסקה, מהתנסויות וטעויות, אבל בהיקפים מטורפים ועם המון דאטה.
על ביג דאטה שמעתם? התחום הזה של מכונה לומדת הוא בדיוק הסיבה שענקי האינטרנט אוספים עלינו מידע בכמויות ענק. בעזרתן הם משפרים את האלגוריתמים והמכונות הלומדות שלהם ויוצרים להן ידע המשתבח והולך.
בלמידת מכונה מצויד המחשב באינטליגנציה מלאכותית ולומד מתוך דוגמאות והתנסויות קודמות שלו ולא בזכות מתכנת אנושי שמזין את הידע למחשב. כלומר, בלמידה כזו מתרחשת הלמידה על ידי המחשב מתוך דוגמאות ומקרים שקרו לו.
האלגוריתם של המחשב ממש מחקה את הדרך שבה פועלת הרשת העצבית שבמוח האנושי. באופן מסוים, מחשבים חכמים כבר הגיעו מזמן לביצועים שמזכירים את הלמידה של תינוקות על ידי חיקוי הוריהם. באופן אחר, הם כל כך משתפרים שיש כבר רבים שמתחילים לחשוש מזה...
המדענים מזהים למידת מכונה, כאשר הביצועים של משימה במחשב הולכים ומשתפרים עם הניסיון. כלומר, בכל פעם שתוכנת המחשב מבצעת משימה, באופן יעיל מאשר ביצעה אותה בעבר. ככל שתוכנה משיגה תוצאות טובות יותר, מבלי שמתכנת אנושי השפיע על הקוד שלה, אז התרחשה למידה חישובית, או למידת מכונה.
#מה עושים בלמידת מכונה?
לא חסרות מערכות שאנחנו פוגשים בהן ביום יום שלנו ומשתמשות בלמידת מכונה. למשל המלצות תוכן כמו שמקבלים מספוטיפיי שמציע לנו שירים שאנחנו עשויים לאהוב או סרטים מומלצים בנטפליקס. זיהוי דואר זבל ואזהרה, לעומת מיילים רגילים בג'ימייל. מערכת זיהוי פנים או טביעת אצבע בכניסה לטלפון, מערכות למניעת הונאה בכרטיסי אשראי ועוד.
מהי למידת מכונה (מתורגם):
https://youtu.be/f_uwKZIAeM0
איך מכונות לומדות? -הנה (מתורגם):
https://youtu.be/R9OHn5ZF4Uo
מאיפה מגיע המידע הנחוץ לאימון המכונה ומה חשוב באיסופו (מתורגם):
https://youtu.be/x2mRoFNm22g
המקור ההיסטורי של משין לרנינג ודרך פעולתה:
https://youtu.be/HBDp183HEic
עוד הסבר על למידת המכונה:
https://youtu.be/mJeNghZXtMo
אחד האתגרים בלמידת מכינה הוא ליצור למידה שאינה מוטית לכיוונים חברתיים ספציפיים:
https://youtu.be/59bMh59JQDo
הסבר קצר על הלמידה החישובית:
https://youtu.be/ty-kTUzMnjk
מחשב לומד שמתבונן בשחקנים המשחקים במשחקי מחשב ולומד לשחק ברמה מקצועית שיכולה להביס את הטובים שבהם:
https://youtu.be/EfGD2qveGdQ
תוכנה לומדת שמשחקת ומשתפרת כל הזמן במשחק מחשב:
https://youtu.be/qv6UVOQ0F44
רוצים לאמן מכונה ואפילו בלי תכנות? - הנה פעילות נחמדה וחכמה:
https://youtu.be/i9tjzr1KME0
AI

סוכני AI הם רכיבי תוכנה אוטונומיים, מבוססי AI, יישומים שנתמכים בבינה מלאכותית ומסוגלים לתפוס את סביבתם, לקבל החלטות ולנקוט פעולות להשגת מטרות ספציפיות עבורנו המשתמשים.
בשנת 2025 החלה תעשיית ה-AI במרוץ לפיתוח מה שנקראים בשפה הפופולרית "סוכנים חכמים" (AI agents), סוכני AI או LLM Agents.
אבל איך זה קורה?
סוכני AI הם עוזרים דיגיטליים בעלי יכולות לפתור בעיות. אלה לא מודלי שפה שעונים על כל השאלות האפשריות או מבצעים משימות מכל הסוגים, אבל באופן בינוני, אלא מנועי בינה ממוקדים, בעלי מומחיות ומצוידים ביכולות לשלב כלים שונים ואמצעים מגוונים בכדי להגיע לפתרונות ב"תחום מומחיותם", כלומר התחום שלשמו פותחו.
סוכני AI הם מנועי תוכנה מבוססי בינה מלאכותית שיכולים לבצע משימות באופן אוטונומי, כלומר עצמאי, בתהליך מעגלי ואיטרטיבי, כלומר עם תיקונים ושיפורים של כל שלב שלא השיג את מטרתו, עד להשגת התוצאה.
מטרתם של סוכני AI טובים היא לחקות את תהליכי התכנון והביצועים הכי טובים של בני אדם מוכשרים ומיומנים בתחומם ומעבר להם...
הבינה המלאכותית מאפשרת כיום לסוכן AI שכזה לבצע פעולות בעצמו. בניגוד לכלי GenAI שמתמקדים בדרך כלל ביצירה של תוכן כמו טקסט, תמונות, סרטונים ומוסיקה - הסוכנים החכמים, ה-AI Agents הללו, מיועדים לפתרון בעיות ממוקד ולביצוע של משימות מורכבות.
סוכן AI מבין שפה טבעית לחלוטין והתקשורת איתו פשוטה ורגילה ולא מחייבת מיומנות מיוחדת, מצידנו בני האדם.
סוכני ה-AI נקראים כך מכיוון שהם עושים את העבודה במקום המשתמש. הם יודעים לדמות התנהגות ויכולות אנושיות, אך בה בעת גם יכולות לא אנושיות. במילים אחרות, סוכני בינה כאלה ממירים את הידע של כיצד לעשות דברים ליכולת אמיתית לעשות אותם ולעשייה ממוקדת כזו, לפי צרכי המשתמש.
סוכנים בינתיים כאלו מאפשרים אוטומציות של פעולות מורכבות ותובעניות מבחינת זמן ובכך הם מביאים להחזר השקעה מהיר. לארגונים וחברות הם מאפשרים להגדיל את הצמיחה ולחסוך לטווח הארוך הרבה כסף. הם מחליפים ויחליפו בעתיד רופאים, מהנדסים, חוקרים ועוד בעלי מקצוע רבים.
סוכן ה-AI הוא המשך של הצ'טבוטים הוותיקים והעוזרים החכמים שעזרו לנו בעשור השני של המאה ה-21. הוא הופך את האינטליגנציה של הבינה המלאכותית לפעולה וליכולות ביצוע. הוא מבין את ההוראות שלך, מעבד את המידע הזה ומספקים את מה שביקשת - תשובה, פתרון, הסבר או עזרה בהשלמת משימה.
ברגע שהוא מוגדר היטב ומצויד בכלי ה-AI המתאימים, הסוכן החכם מטפל במשימות באופן מושכל ומדויק, מתכנן, מקבל החלטות ומבצע באופן אוטומטי פעולות מעייפות ושוחקות, לצד "עבודות שחורות". כך הוא משחרר את המשתמשים להתמקד בעניינים חשובים יותר.
כשהסוכנים החכמים הללו עובדים, כולנו מבינים שהמשימה תבוצע. בהתחייבות של AI. זו מהפכה שעומדת להיות מהפכה מטורפת ומובילי הטכנולוגיה חוזים שהאייג'נטים הללו, אותם סוכני AI, יהיו התוכנות החדשות, שהעולם יהיה מלא בהם.
אבל מיהם אותם סוכנים ומה בדיוק הם מאומנים ויכולים לעשות בשבילנו?
#מה זה סוכן AI?
אם AI באנגלית הוא ראשי התיבות של בינה מלאכותית, צריך להבין שבינה מלאכותית לכשעצמה היא מוח גולמי עם ים של פוטנציאל. אבל עד שלא נשאל אותה, עד שלא נבקש ממנה לעשות משהו ספציפי, ניתן לה תפקיד או משימה, היא לא תהיה ממש שימושית.
וזו בדיוק המשמעות של סוכן חכם, או סוכן AI. אם בינה מלאכותית היא גאון עם המון יכולת, אך סוג של "ראש קטן", סוכן AI הוא ביצועיסט, בינה מעשית שבאמת נותנת עבודה. יש לה יכולות מסוימות ומוגדרות והיא מתמחה בהן ורק בהן ואותן היא מבטיחה לבצע.
במילים פשוטות, האייג'נט עם ה-AI הוא עוזר וירטואלי חכם שמסוגל לבצע בעצמו משימות ספציפיות, תוך שימוש יעיל ביכולות הבינה המלאכותית. כמו ששעון מעורר יכול להעיר אותנו בבוקר, סוכני בינה ספציפיים כאלו יכולים לבדוק ולענות על המיילים שלנו, לקבוע לנו פגישות, לערוך קניות, למכור שירותים ומוצרים ללקוחות, לתכנן טיול או חופשה בחו"ל, חיפוש באינטרנט, הזמנת טיסות, למצוא לנו בדיחות לערב סטנדאפ בכיכובנו, או לנגן לנו מוסיקה לפי מצב הרוח שלנו.
כלומר, בזמן שבינה מלאכותית עניינה להיות חכמה נורא ולדעת הכל, הסוכן החכם עם ה-AI הוא הגרסה המעשית. הוא זה שמבצע משימות מוגדרות ומבצע אותן היטב. אפשר לדמות אותו למישהו מוכשר שמתגייס לצבא ואחרי שאומן לביצוע משימות מסוימות. הוא ממתין לפקודות שיקבל, או מבצע משימות לפי זמנים ותגובות, וכשהגיע הזמן לבצע את המשימה, או כשהוא מקבל פקודה לביצוע, הוא "עושה את מה שצריך" ומבצע וממלא את ההוראות.
#איך הם עושים זאת?
התשובה הכי קצרה היא: באמצעות ביצוע של משימות בצורה חכמה, עצמאית ויעילה.
סוכני AI מאומנים ומצוידים, כך שהם יידעו כיצד להגיב הכי טוב לדרישות, למצבים ולצרכים שונים. הם מבצעים את המבוקש מהם, לאחר שקיבלו הוראות מפורטות וגם נתונים שהם צריכים לקבל או לאתר.
סוכנים מצוידי AI נבנו כך שיהיו מסוגלים להבין דרישות, לחוש את המשתמש, לפרש נתונים, להבין את הסביבה, לקבל החלטות מושכלות ולבצע פעולות מורכבות יחסית - עד שיצליחו להשיג את המטרות שהוגדרו מראש.
כך מצליחים סוכני בינה מלאכותית כאלו להגביר את היעילות שלהם עבורנו, בני האדם. הם עושים זאת למשל, על ידי אוטומציה של משימות שגרתיות שמוטלות עלינו, מה שנקרא לא פעם "עבודה שחורה".
בכך מאפשרים הסוכנים הבינתיים הללו לעובדים האנושיים שאנחנו, להתרכז באסטרטגיה ויצירתיות.
מודלי השפה הרחבים (LLMs) שבהם הם מצוידים מאפשרים לאייג'נטים הללו לבצע משימות בצורה עצמאית ויעילה. עוד משולבים בהם מודלים מתקדמים לעיבוד שפה טבעית, מה שמאפשר להם להבין פרומפטים, הוראות, הנחיות וטקסטים בכתיבה טבעית. תוך יישום של טכניקות ניתוח מתקדמות כמו "העץ המחשבה" או "שרשרת המחשבה" (Chain of Thought) וביחד עם טכניקות ויכולות של למידת מכונה, הם יכולים להציע ביצועים מדהימים.
הסוכנים משפרים את הפרודוקטיביות, מפחיתים טעויות ומאפשרים שיתוף. חלקם ממלאים משימות מוגדרות מראש, אחרים עונים על שאלות, יש היכולים לתקשר בקול אנושי ולנהל שיחה רגילה. לעתים הם מתוכנתים לנהוג ולחשוב כאילו הם פקיד, מזכירה, מנהל חשבונות, מדענית, סוכן נסיעות או תחקירן - רבים מהם ספציפיים וממלאים משימה אחת היטב ואחרים ממלאים מגוון של משימות ואפילו בו-זמנית.
ההבנה היא שבאמצעות יכולת ניתוח של נתונים מורכבים ויכולת למידה מתמשכת הסוכנים החכמים הללו ימשיכו לפעול ולצבור ניסיון, תוך שהם הופכים ומתחדדים, לכלים נבונים ובעלי ביצועים טובים יותר ויותר.
#איך עובדים איתם?
אתם נכנסים לסוכן אינטליגנטי שאתם יודעים שמבצע משימה מסוימת ונותנים לו הוראות. מצידו, תהליך העבודה מתחיל בקבלת המטרה המוגדרת שנתתם לו. הוא מפתח במהירות הבזק תוכנית פעולה, בוחר את הכלים המתאימים לביצוע של המשימה שלא פעם הוא יפרק למשימות משנה וכאן מגיע ביצוע המשימות בפועל והערכה של התוצאות.
הכל מתבצע בצורה אוטונומית, מבלי להיעזר בכם. בדרך כלל הסוכן מסתמך על נתונים והקשרים שנאספו במהלך ה"שיחות" הקודמות שלכם ו"לומד אתכם" ומה הציפיות שלכם ממנו.
כי אחת התכונות החשובות של סוכני AI נעוצה ביכולת שלהם ללמוד ולהשתפר לאורך זמן. הם מנתחים כל הזמן את תגובותיכם והפעולות שלכם, לומדים מהמשוב שקיבלו מכם ומבצעים התאמות שישפרו את הביצועים שלהם. כך יכולים סוכני AI להתפתח ולהתאים את עצמם לצרכים המשתנים שלכם ולהגיב טוב ומדויק יותר למגוון רחב של צרכים וסיטואציות.
סוכן ה-AI מגיש לכם את התוצאות ואתם מוזמנים להמשיך ולנהל איתו דיאלוג. אפשר לבקש ממנו הרחבות ושיפורים. תוכלו גם להכניס שינויים בבקשה המקורית או עדכונים, להטיל עליו לבצע פעולות שישפרו את הדיוק למה שיתאים לצרכים שלכם וכך הלאה.
#דוגמאות?
האפשרויות כמעט אינסופיות. כבר היום יש סוכנים חכמים רבים. יש מהם שיכולים לבצע חישובים, לחפש באינטרנט, להבין תמונות, לנתח מסמכים מורכבים, לגשת למאגרי מידע ולהפעיל המון כלים נוספים.
יש סוכנים שנותנים תשובות על שאלות בתחומים שונים כמו משפטים או מיסים, אחרים בונים תכנית טיול שמותאמת לבקשותינו ולכלל המשתנים, יש שמזמינים כרטיסים להופעות או מקומות במסעדות, אחרים מנסחים טקסטים וכדומה.
בבית חכם יכול AI אג'נטי לשלוט בתאורה, בחימום ובאבטחה - על ידי שילוב עם מערכות אחרות, במטרה ליצור סביבת מגורים נוחה וקלה.
יש מהם שמבצעים אוטומציות שעושות בשבילך את העבודה, ממיינות את המיילים או מטפלות ב-To do list, כלומר ניהול המשימות האישי ועוד.
סוכני AI ייעודיים אחרים מפיקים טקסטים מותאמים אישית, למטרות כמו אימיילים, דו"חות, קורות חיים וחומרי שיווק. יכולותיהם מתגלות במיטבן כשהם מצליחים להתאים את רמת האוטונומיה שלהם, בהתאם לצרכים של המשתמשים ומטרותיהם.
הנה הסבר פשוט ולעניין של סוכני ה-AI:
https://youtu.be/wazHMMaiDEA
הבשלת היכולות של סוכנים חכמים מצוידי AI היא תוצאה של שנות התפתחות רבות:
https://youtu.be/WftLJZw6Cf8
צריך לתת סיכוי לסוכני AI חכמים (מתורגם):
https://youtu.be/xq8Ws1jyBX4
כך יוצרים סוכן AI בכלי שנקרא n8n:
https://youtu.be/6DLZK7XDOGo
סוכן AI לפיתוח כלי תוכנה ואפליקציות רשת:
https://youtu.be/aWBiZc5XKJM
הצ'טבוט המתקדם של Open AI שמשמש מתורגמן:
https://youtu.be/c2DFg53Zhvw
הכירו את ה-Projects של קלוד לבניית ושימוש בסוכני AI (עברית):
https://youtu.be/8mWR1r28ia4
הנה הסבר מקיף של סוכני ה-AI החדשים:
https://youtu.be/S9dc0y_Zesc?long=yes
סוכן ה-AI המתכנת המוביל:
https://youtu.be/Wvyc2E6OHm8?long=yes
והדגמת GPT 4o שהופך לסוכן AI ומסוגל לעשות פעולות שונות בשירותך:
https://youtu.be/DrKkKLEditU?long=yes

צ'אטבוט (Chatbot) הוא סוג של סייען חכם וממוחשב, שניתן לשוחח איתו בהתכתבות צ'אט, או במקרה של צ'אטבוט מתקדם יותר גם שיחה מבוססת דיבור.
כמובן שהצ'אטבוט הוא מערכת מבוססת AI (בינה מלאכותית, או אינטליגנציה מלאכותית) שמייצרת שיחה מלאכותית עם המשתמש - מבלי שבצד השני נמצא אדם אמיתי.
בעשור השני של המאה ה-21 הצ'אטבוט הלך ותפס את מקומו ברשת ובאפליקציות שונות והפך לדרך חדשה לחלוטין להשתמש באינטרנט. לקוחות מצאו את עצמם מנהלים התכתבות בצ'אט או שיחה אוטומטיות עם בוט, שנתן מענה מותאם אישית ושיפר את עצמו עם הזמן.
הצ'טבוט הבטיח לספק שירות לאורך כל שעות היממה, 24/7. הוא סימן הפחתה של המון מהעומס של שירות הלקוחות האנושי, חסך זמן למתעניינים וללקוחות שביקשו שירות וחסך לעסקים הרבה כסף.
התגלה שבוט AI ממוקד ואיכותי מסוגל להציע תגובות מהירות ומדויקות, מה שהוביל לשיפור ניכר בחוויית הלקוח ולעלייה בשביעות הרצון, אף שהיו לקוחות שהתעקשו לשוחח עם בן אדם, שהיה עמוס עכשיו פחות ולכן גם זמין להם הרבה יותר.
היתרונות של הצ'טבוט בטיפול אישי במשתמש ובלקוח היו עצומים. שולבו בו טכנולוגיות פרסונליזציה מתקדמות שהלכו והתפתחו, תוך גיוס הבינה המלאכותית לצרכי השיווק, המכירות והתמיכה.
רבים חזו שצ'אטבוטים עשויים להחליף חלק ניכר מהשימוש באתרי שירותים שונים ולייתר אותם בעתיד, מה שהתממש אבל חלקית.
בזמנו החליטה פייסבוק להשתמש בצ'אטבוטים בתוך שירות המסרים שלה מסנג'ר. היא אפשרה למפתחים חיצוניים לפתח צ'אטבוטים שיתנו שירותים ומידע מאתרים אחרים. ההכרזה על פלטפורמת הצ'אט בוט של פייסבוק מסנג'ר קדמה את רעיון הצ'אטבוטים המקוונים באופן משמעותי, במיוחד למשתמש הנייד בסמארטפונים ושעונים חכמים, אם כי הזינוק הטרנדי שנוצר עם ההשקה הלך ונרגע עם הזמן.
ההבשלה של אותם צ'אטבוטים באה בעשור הבא דווקא. זה קרה עם הגעתו של ChatGPT, מודל השפה הגדול הראשון (LLM), שאחריו הגיעו נוספים, כמו Gemini או Claude. מודל השפה הזה הוא בעיקרון מנוע בינה מלאכותית גדול ורחב-אופקים, המצויד ביכולת להבין שפה טבעית, אנושית, ויכול לעשות המון דברים, כלומר להתמודד עם מגוון ענקי של משימות ושהיכולות שלו הולכות וגדלות מיום ליום. ראו בתגית "LLM".
ממודלי השפה הגדולים התפתחו גם מנועי היצירה של הבינה הג'נרטיבית (Generative AI), המייצרים תמונות, שירים, וידאו ועוד. הכירו בתגית "GenAI".
אחריו נולדו סוכני ה-AI, צ'אטבוטים שממלאים משימות עבורך, על ידי שילוב בין היכולת הבינתית של מודל השפה הגדול כמו ChatGPT, עם היכולת של רכיב תוכנה שיכול לפעול באופן עצמאי וממוקד, למילוי של משימה ספציפית עבורנו, כמו לתכנן טיול, לקנות מוצרים אונליין, לטפל בדואר האלקטרוני שלנו וכדומה.
אותם סוכני AI הם רכיבי תוכנה אוטונומיים, יישומים מבוססי בינה מלאכותית, המסוגלים לתפוס את סביבתם, לקבל החלטות ולפעול לביצוע או השגת מטרות ממוקדות בשירות המשתמש. הכירו אותם בתגית "סוכני AI".
כלומר, אם הצ'טבוט של העשור שהחל ב-2010 היה עובד חרוץ אך לא חכם מדי, הצ'טבוט הבינתי של מודל השפה הגדול בעשור שאחריו רכש השכלה ופיתח את יכולותיו האינטליגנטיות באופן שהפך אותו למומחה ואז מגיע הסוכן הבינתי, AI agent והוא כבר עובד שמתמחה במשימה מסוימת ועושה אותה בצורה מיומנת וחרוצה.
עסקה טובה לרובנו.
פעילות נחמדה
============
בקישורים שלמטה יש לינק לצ'ט בוט נהדר. נסו לשוחח איתה (באנגלית) ולהכיר קצת את חוויית השיחה עם צ'ט בוט אופייני.
הנה עולם הצ'אטבוט:
http://youtu.be/iE9LtfQAYYU
עוד על השימוש בצ'אטבוטים ברשת:
http://youtu.be/G8z--x5tFOI
ההכרזה על הצ'אט בוט במסנג'ר של פייסבוק:
http://youtu.be/EOYnFUJyOlQ
ומנגד - כשהושק הצ'אטבוט של מיקרוסופט הוא "הסתבך" עם ביטויי גזענות קשים:
http://youtu.be/LA49GBcbudg

הגדרה פשוטה של האינטליגנציה המלאכותית או הבינה המלאכותית (Artificial Intelligence) היא: כל דבר שמחקה את האינטליגנציה שלנו כבני אדם באמצעות מחשבים.
בינה מלאכותית היא תוכנה או מכונה שיכולה לפתור בעיות שאדם יכול לפתור. בניגוד למחשבים של פעם, שהיו מסוגלים להתמודד עם בעיות חישוביות, אך לא לחשוב, מערכת כזו מסוגלת לחקות חשיבה של ממש, כולל חשיבה מופשטת (על מושגים), דמיון, הסקת מסקנות לוגיות, ראייה, הבנת שפה טבעית, דיבור, הבנת העולם והכי חשוב, למידה.
מערכת כזו יכולה לא פעם ללמוד ולהתפתח מבחינת יכולותיה, ממש כמו שאנו לומדים כל הזמן וכך נעשים חכמים יותר. כך תלמד ותפעל המערכת על פי הבנתה ואז היא תהיה "מכונה לומדת". תחום למידת המכונה מתמחה ברעיון הזה, של פיתוחי מערכות לומדות ואימון שלהם, כמו שהורה או מורה מאמן ילד שגדל. קראו על כך בתגית "למידת מכונה".
יש גם תחום של "למידה עמוקה", בו המכונה "לא צריכה" אנשים שילמדו ויאמנו אותה, אלא לומדת, מסיקה מסקנות ומפתחת יכולות בעצמה. הרחיבו על כך בתגית "למידה עמוקה".
באופן כללי, בינה מלאכותית יכולה לחשוב. שימוש במידע שנאסף מבחוץ (בעזרת החושים) וזה שבפנים (ממאגרי הזיכרון והידע שצברנו בעבר) מאפשר את החשיבה הזו. לחשוב פירושו להשתמש במידע הזה ולארגן אותו מחדש ובכך ליצור מידע חדש. המידע שנוצר הוא הלמידה שלנו, ההמצאות שלנו, היצירות האמנותיות, ההומור וכדומה.
המבחן למערכת שיש בה בינה מלאכותית הוא "מבחן טיורינג". על פי מבחן זה, רק תוכנה אחת הצליחה עד היום להצטייר כבעלת תבונה ברמה שכזו (ראו באאוריקה בתגית "מבחן טיורינג").
הנה הסבר קצר ומהיר על הבינה המלאכותית:
https://youtu.be/acnIX2b2lpY?t=11s
דברים שמייצר ה-AI וכיצד הוא התפתח כל כך:
https://youtu.be/XtlC-rCjUyM
לאט ופשוט על הבינה המלאכותית:
https://youtu.be/hE74j-nD-q8
העולם של האינטליגנציה המלאכותית (עברית):
https://youtu.be/xcOw84E93MI
כך ה-AI ישנה ומשנה את העולם (מתורגם):
https://youtu.be/RzkD_rTEBYs
על רובוטים ומערכות תיב"ם (תכנון באמצעות מחשב), שמשתמשים בבינה מלאכותית (עברית):
https://youtu.be/g0yEDyEppeM
רובוט יצירתי שיכול להמציא בעצמו ולא רק לחזור על דברים שהוכנסו לתוכו:
https://youtu.be/-U-lQYwzFAQ
קבלו את iCub שיכול להבחין בדברים שתינוק יכול לדעת:
https://youtu.be/2oJSJa6P_EI
מה שאומר שיצירתיות היא חלק מהבינה המלאכותית (מתורגם):
https://youtu.be/Rh9vBczqMk0
הרצאת טד על הבינה המלאכותית שתשחרר אותנו מעבודה שחורה ולא יעילה (מתורגם):
https://youtu.be/ajGgd9Ld-Wc?long=yes
וסרטון תיעודי על האינטליגנציה המלאכותית:
https://youtu.be/53K1dMyslJg?long=yes

עיבוד שפה טבעית, או NLP, משתמש במחשבים ובטכנולוגיות של בינה מלאכותית, המתמקדות בפיתוח אלגוריתמים המאפשרים למחשבים לקרוא, להבין ולתקשר בשפה רגילה, כתובה או מדוברת אבל טבעית, שפה של בני אדם.
NLP הם ראשי תיבות של "Natural Language Processing" ובעברית "עיבוד שפה טבעית". זהו תת-תחום בבינה מלאכותית, הקשור בצד הבלשני שלה, צד השפה המדוברת.
ניתן לומר בפשטות שהמטרה של עיבוד שפה טבעית היא שמחשבים יוכלו לתקשר עם בני אדם באותו אופן בו אנו, בני האדם, מתקשרים בינינו.
עיבוד השפה הטבעית קשור לתחום הבלשנות החישובית והוא משלב רעיונות מתחום מדעי המחשב בחקר השפה האנושית. התחום הזה במחשוב עוסק בבעיות הקשורות לעיבוד, טיפול ושינויים או מניפולציה של השפה הטבעית האנושית.
מטרת ה-NLP היא להבין שפות אנושיות, לנתח את התוכן והכוונה של המסרים שבהן ולהצליח לפרש את משמעותם הבסיסית, כך שניתן יהיה לגרום למחשבים "להבין" דברים שנכתבים או נאמרים בשפה הטבעית, כלומר בשפות של בני-אדם.
לשם כך, מודלים של NLP משתמשים בנוסחאות או בעצם אלגוריתמים של למידת מכונה, יחד עם שילוב כללים מוגדרים מראש.
בשנים האחרונות זוכה התחום לעניין רב, כחלק מהפיתוח של יישומי מחשב, רובם מבוססי בינה מלאכותית, יישומים שהתקשורת עימם היא בשפה אנושית.
רבים מהכלים הללו מחייבים תיאורים מילוליים של התוצר המצופה מהם, מנהלים שיחה עם המשתמש או מטפלים בטקסטים באופנים שונים. חלקם מייצרים ויוצרים יצירות באופן דומה ליצירה אנושית, מה שמחייב הנחיות, פרומפטים המהווים תיאור טקסטואלי של תוכן ואופי התוצרים המצופים, כמו תמונות, סרטים, מוסיקה, קוד ועוד.
עיבוד השפה הטבעית קשור לתחום הבלשנות החישובית והוא משלב רעיונות מתחום מדעי המחשב בחקר השפה האנושית.
הנה הסבר פשוט של NLP במדעי המחשב:
https://youtu.be/pqgUfv7UP4A
היישומים המדהימים של עיבוד שפה טבעית לתקשורת בינינו ובין מערכות AI:
https://youtu.be/TZMZvULBVio
זה עיבוד שפה טבעית בלמידת מכונה:
https://youtu.be/CMrHM8a3hqw
מטרת ה-NLP בעולם של ימינו:
https://youtu.be/7NObIGHhQWA
עיבוד השפה הטבעית בטכנולוגיות AI יומיומיות:
https://youtu.be/43cXcuXGnXk
אי אפשר לדבר על NLP בלי לדבר על LLM (עברית):
https://youtu.be/ugxgxqRg2-I
פרמטרים וטוקנים הם לא הכל במודלים:
https://youtu.be/a1nqXQMOCks

מאסימוני הטלפונים ועד עולם אבטחת מערכות מחשוב, טוקן (Token), בעברית “אסימון”, הוא מושג המשתנה בהתאם להקשר שבו הוא מוזכר. אפילו בתוך עולם המחשבים יש למושג טוקן כמה שימושים.
בלמידת מכונה, אחת הזירות המרתקות של העידן המודרני והתחום בו פועלים מודלי השפה הפופולריים של ימינו, כמו Claude או ChatGPT, לטוקנים יש משמעות אדירה.
אותם מודלים גדולים, LLMs, הם מודלים מתמטיים. כדי לבצע את המשימות שאנו מבקשים מהם, תוך כדי תקשורת איתם בשפה טבעית, כמו אנגלית, עברית וכדומה, הם משתמשים בתהליך שנקרא "טוקניזציה" (Tokenization).
במרכז הטוקניזציה נעשה פילוח של הטקסטים שהמודלים הללו מקבלים כנתונים, כדאטה, ליחידות קטנות יותר, תרגום של חלקי המידע הקטנים למספרים, כשאת יחידות המידע הללו, שהומרו למספרים, הם ינתחו בהמשך.
כך, אחרי שמסתיימת הטוקניזציה, הם מייצרים מהמידע טוקנים, מספרים שכל אחד מהם מייצג פריט מידע קטן. ה"טוקן" משמש בהם בתפקיד "אסימון למידת המכונה", שמתאר באופן מתמטי את יחידות הטקסט הקטנות. אלה מעין יחידות מידה שהמודלים המוכרים יוצרים מהקונטקסט.
לאחר שסיימו להפוך את המידע לטוקנים, מרבית המודלים שאנו מכירים הטוקנים משמשים לייצוג של הטקסט, ביחידות קטנות שהמודל מעבד בצורה מתמטית.
כשאנו משתמשים בטוקנים, זה כדי לסייע למודל להבין את המבנה של הטקסט, כך שיוכל לבצע על פיו את החישובים שלו. טוקן אחד יכול להיות כל חלק ממילה בשפה הרגילה שלנו, או אפילו תו אחד.
כדי להבין ולהגיב לקלט, המודל משתמש בכמות מסוימת של טוקנים. וטוקן יכול להיות כל פיסת מידע, מתו בודד ועד מילה שלמה ולעתים גם יותר. יש שיטות שונות של טוקניזציה והבחירה ביניהן היא בהתאם לאלגוריתם בו משתמשים. יש שהאסימון הוא לפי תווים (Character tokenization), אסימון לפי מילים, לפי משפט, ביטויים, טוקניזציה לפי מילת משנה ולפי מספר.
בשיחה על מודל AI (ה-LLM, כמו ChatGPT או Claude) משמש הטוקן לציון גודל השיחה על המודל והיקף המידע שיכול להיות בה. לכל מודל יש מגבלה של זיכרון התוכן שהוא יכול לעבד בשיחה אחת ולהתבסס עליו בתשובות שלו ובמהלך השיחה.
כל הטקסט שהמודל מכיל ובא מהקלט שמזרים לו המשתמש, כולל השאלות והתשובות וכל מידע נוסף, כל אלו מכונים "קונטקסט" (Context), כלומר "ההקשר".
חלון ההקשר (Context window), או "חלון הקונטקסט", מייצג את כמות התוכן שהמודל יכול לעבד בשיחה עם משתמש. הכמות הזו נספרת בטוקנים. אם קלוד, למשל, תומך ב-200 אלף טוקנים, זה אומר שהשיחה יכולה לכלול כ-40 אלף מילים. אם לג'מיני של גוגל יש מיליון טוקנים, זה אומר פי 5 יותר מילים וגודל חלון הקונטקסט שלה, כלומר השיחות עם ג'מיני הוא של כ-2 ספרים ממוצעים.
גם מהירויות של מודלים מודגמת לא פעם בטוקנים לשנייה. לא נדיר לראות השוואת מהירויות כמו "מודל ה-Sonar החדש של Perplexity מגיע לביצועים של עד 1200 טוקנים לשניה, בהשוואה ל-75 טוקנים לשניה בלבד של המודל Claude 3.5 Sonnet" או 140 טוקנים לשניה של Gemini 2.0 Flash של גוגל".
טוקניזציה כפי שהיא נעשית בידי מדעני נתונים:
https://youtu.be/fNxaJsNG3-s
פרמטרים וטוקנים הם לא הכל במודלים:
https://youtu.be/a1nqXQMOCks
הסבר של Machine Learning Token באנגלית:
https://youtu.be/mnqXgojQCJI
וטוקניזציה באתרי אינטרנט שיכולה לשמש בהקשר אחר כאמצעי אבטחה:
https://youtu.be/Y7I4IDojhJk
מהי מולטי מודאליות בעולם ה-AI?
זה אחד הפיתוחים המרגשים של עידן הבינה החדש ומה שמרגיש לא פעם כמו סרטי מד"ב מהיותר מתוחכמים. קוראים לזה מולטי-מודאליות (Multimodality) והוא בעצם היכולת של כלי AI לעבוד עם סוגי נתונים שונים, כמו טקסט, אודיו, קוד, וידאו ותמונות - גם כקלט וגם כפלט.
במקום להתמקד בסוג אחד בלבד של נתונים, מערכת רב-מודאלית מקבלת ומנתחת מידע ממקורות מגוונים, בכדי לקבל הבנה מעמיקה יותר של העולם הסובב אותה. מדובר בכלי ממוחשב שבדיוק כמו שבני אדם חווים את העולם דרך כל החושים והחוויות, לא רק מבין טקסט, אלא גם רואה תמונות וסרטים, מעבד ומנתח וידאו, מגלה הבנה מרחבית, שומע קולות וצלילים, מפענח קוד של תוכנה ומסוגל גם ליצור תכנים ותוצרים בכל המדיות הללו.
בדומה למוח האנושי, המשלב בטבעיות מידע מכל החושים, העולם של המערכות המולטי מודאליות ב-generative AI מציג יכולת שהיא עוד רכיב במהפכה הגדולה של מערכות בינה מלאכותית, מהפכונת שמאפשרת לעבד ולשלב כמה סוגי מדיה במקביל.
המערכות החדשות הללו מצוידות בשכבות מורכבות של פענוח ומפענחות את העולם פחות או יותר כמו מחשב-על. דוגמאות לא חסר. למשל עם צ'טבוט שבזכות ההבנה המרחבית המשופרת שלו מסוגל לזהות ולהוסיף כיתוב מדויק לעצמים שונים בתמונות עמוסות פריטים. או צ'טבוט שמנתח תמונות ומאפשר למשתמש לנהל עליהן דיון, או סוקר אינפוגרפיקה ונותן לה פרשנות קולית רלוונטית, בהתאם לרמת ההבנה של המשתמש או קהל היעד המבוקש. לכלי כזה יש גם כלי וידאו שמקבלים תמונה והנחייה כתובה (פרומפט) ומנפישים את התמונה לקליפ וידאו שכמו צולם בידי צוות צילום הוליוודי.
דוגמה נוספת היא כלי אינטראקציה רב-מודאלי כמו NotebookLM. הוא מאפשר למשתמשים לשתף איתו את המסך או המצלמה שלהם בזמן אמת. כך ניתן לקיים שיחות קוליות דמויות אדם, תוך כדי שמאפשרים ל-AI לצפות במסך ולעזור, תוך כדי מודעות להקשר ולתוכן.
אפילו תכונת זיהוי הפנים בסמארטפון שלכם היא תכונה שמשלבת היטב ראייה ממוחשבת, מיפוי תלת-ממדי ועיבוד נתונים מתקדם. ומאלה היא יוצרת פיצ'ר מדהים, בצד חווית משתמש פשטותה כמו מבט של שומר אנושי.
שילוב של צורות נתונים מרובות, כמו טקסט, תמונות ואודיו לתוך מערכת מאוחדת ורב-מודאלית היא שמאפשרת למודלים כמו Claude או GPT-4 לכתוב קוד כשמזינים לתוכו דיאגרמה ולמודלים שונים ליצור תמונות או סרטוני וידאו עם תיאורים.
את המהפכה המולטימודאלית אפשר לזהות בקלות בפלטפורמות כמו טיקטוק (TikTok) ואינסטגרם (Instagram), בהן משלבים סוגי מדיה מגוונים ומעבדים במגוון כלים, המשנים את הדרך בה אנו מספרים את הסיפור שלנו לעולם.
הנה הסבר היכולת המולטי-מודאלית:
https://youtu.be/97n1u66Shgg
כך עובדים מערכות מולטי מודאליות:
https://youtu.be/WkoytlA3MoQ
וההיפר מודאליות החדשה של גוגל מארינר:
https://youtu.be/KeUMm1xF3o0?long=yes
זה אחד הפיתוחים המרגשים של עידן הבינה החדש ומה שמרגיש לא פעם כמו סרטי מד"ב מהיותר מתוחכמים. קוראים לזה מולטי-מודאליות (Multimodality) והוא בעצם היכולת של כלי AI לעבוד עם סוגי נתונים שונים, כמו טקסט, אודיו, קוד, וידאו ותמונות - גם כקלט וגם כפלט.
במקום להתמקד בסוג אחד בלבד של נתונים, מערכת רב-מודאלית מקבלת ומנתחת מידע ממקורות מגוונים, בכדי לקבל הבנה מעמיקה יותר של העולם הסובב אותה. מדובר בכלי ממוחשב שבדיוק כמו שבני אדם חווים את העולם דרך כל החושים והחוויות, לא רק מבין טקסט, אלא גם רואה תמונות וסרטים, מעבד ומנתח וידאו, מגלה הבנה מרחבית, שומע קולות וצלילים, מפענח קוד של תוכנה ומסוגל גם ליצור תכנים ותוצרים בכל המדיות הללו.
בדומה למוח האנושי, המשלב בטבעיות מידע מכל החושים, העולם של המערכות המולטי מודאליות ב-generative AI מציג יכולת שהיא עוד רכיב במהפכה הגדולה של מערכות בינה מלאכותית, מהפכונת שמאפשרת לעבד ולשלב כמה סוגי מדיה במקביל.
המערכות החדשות הללו מצוידות בשכבות מורכבות של פענוח ומפענחות את העולם פחות או יותר כמו מחשב-על. דוגמאות לא חסר. למשל עם צ'טבוט שבזכות ההבנה המרחבית המשופרת שלו מסוגל לזהות ולהוסיף כיתוב מדויק לעצמים שונים בתמונות עמוסות פריטים. או צ'טבוט שמנתח תמונות ומאפשר למשתמש לנהל עליהן דיון, או סוקר אינפוגרפיקה ונותן לה פרשנות קולית רלוונטית, בהתאם לרמת ההבנה של המשתמש או קהל היעד המבוקש. לכלי כזה יש גם כלי וידאו שמקבלים תמונה והנחייה כתובה (פרומפט) ומנפישים את התמונה לקליפ וידאו שכמו צולם בידי צוות צילום הוליוודי.
דוגמה נוספת היא כלי אינטראקציה רב-מודאלי כמו NotebookLM. הוא מאפשר למשתמשים לשתף איתו את המסך או המצלמה שלהם בזמן אמת. כך ניתן לקיים שיחות קוליות דמויות אדם, תוך כדי שמאפשרים ל-AI לצפות במסך ולעזור, תוך כדי מודעות להקשר ולתוכן.
אפילו תכונת זיהוי הפנים בסמארטפון שלכם היא תכונה שמשלבת היטב ראייה ממוחשבת, מיפוי תלת-ממדי ועיבוד נתונים מתקדם. ומאלה היא יוצרת פיצ'ר מדהים, בצד חווית משתמש פשטותה כמו מבט של שומר אנושי.
שילוב של צורות נתונים מרובות, כמו טקסט, תמונות ואודיו לתוך מערכת מאוחדת ורב-מודאלית היא שמאפשרת למודלים כמו Claude או GPT-4 לכתוב קוד כשמזינים לתוכו דיאגרמה ולמודלים שונים ליצור תמונות או סרטוני וידאו עם תיאורים.
את המהפכה המולטימודאלית אפשר לזהות בקלות בפלטפורמות כמו טיקטוק (TikTok) ואינסטגרם (Instagram), בהן משלבים סוגי מדיה מגוונים ומעבדים במגוון כלים, המשנים את הדרך בה אנו מספרים את הסיפור שלנו לעולם.
הנה הסבר היכולת המולטי-מודאלית:
https://youtu.be/97n1u66Shgg
כך עובדים מערכות מולטי מודאליות:
https://youtu.be/WkoytlA3MoQ
וההיפר מודאליות החדשה של גוגל מארינר:
https://youtu.be/KeUMm1xF3o0?long=yes
מהי טכנולוגיית הדיפ נוסטלגיה?
בשנים האחרונות הולכת ותופסת את מקומה טכנולוגיה מבוססת בינה מלאכותית (AI) שנקראת דיפ פייק (Deepfake). טכנולוגיה זו משמשת לייצור או שינוי תוכן וידאו כך שהיא מציגה מציאות שלמעשה לא התרחשה מעולם. מנאומים שלא ננאמו מעבירים מסרים בדויים מפיהם לכאורה, של אנשים מפורסמים ועד סרטונים "פסאודו-תיעודיים", שמציגים מראות וטקסטים מדוברים, שנראים אמיתיים אך מעולם לא צולמו והוקלטו.
ענף חדש בעולם הדיפ פייק הוא יישום שזכה לשם "דיפ נוסטלגיה" (™Deep Nostalgia), המנפיש את פניהם של אנשים שצולמו בתמונות ישנות או היסטוריות, ומזיז את פניהם, כאילו צולמו בווידאו.
הטכנולוגיה הזו פועלת על כל תמונת סטילס (תמונות קפואות), כולל תמונות בשחור-לבן ותמונות שצולמו בצבע.
השם ניתן ליישום פורץ דרך זה על ידי חברת MyHeritage, שעוסקת בפיתוח טכנולוגיה ליצירת עצי משפחה מקוונים.
סרטוני הדיפ נוסטלגיה התפרסמו כשאנשים שיתפו עם בני משפחתם וחבריהם סרטונים קצרים ומונפשים שנוצרו כך, ובהם קרוביהם ואבותיהם מזיזים את ראשיהם, מצמצים, מחייכים ונעים בצורה ריאליסטית כמעט לחלוטין.
#איך פועלת הדיפ נוסטלגיה?
דיפ נוסטלגיה מחזירה, אם כן, לחיים אנשים שצולמו בצילומי סטילס. זה מתחיל באיתור פני המצולמים בתמונות ואז הפקה של מחוות ותנועות מציאותיות, ממש כאילו צולמו בווידאו. ההנפשה של הפנים בתמונות הסטילס מראה אותם מחייכים, זזים וממצמצים, כאילו צולמו כך במקור.
בבסיס הטכנולוגי של יישום ה"דיפ נוסטלגיה" פועל אלגוריתם למידה עמוקה (Deep Learning), המחבר בין תווי הפנים של המצולמים לבין אוסף מחוות שצולמו בווידאו ושמורים במאגר החברה.
פיתוח וצילום אותן מחוות נעשה כשצילמו אנשי מיי הריטג' מראש שלל מקטעי וידאו של שחקנים ועובדי החברה, המזיזים את ראשיהם ופניהם באורח טבעי, ממצמצים, מחייכים ומפנים את ראשם לכיוונים שונים.
למעשה שכרה חברת MyHeritage רישיון מחברת D-ID, לטכנולוגיה שפותחה בה ומאפשרת שחזור, באמצעות טכנולוגיית למידה עמוקה, של סרטוני וידאו.
על מנת שאפקט ההנפשה יופעל על התמונות, ברזולוציה הכי גבוהה האפשרית, עוברות תמונות מטושטשות חידוד אוטומטי, שמבצעת הטכנולוגיה החדשנית, מה שמעלה באופן דרמטי את איכות הסרטונים המופקים בה.
ההברקה האמיתית של הטכנולוגיה הזו נעוצה בזיהוי והבחירה האוטומטית שמבצע יישום הדיפ נוסטלגיה, מבין מקטעי המחוות בווידאו. ניתוח מהיר של מנח הראש וכיוון העיניים של המצולמים בתמונה מאפשרים ליישום להתאים להם באופן חכם את מחוללי ההנפשה המיטביים ולייצר את הסרטונים המונפשים באופן אופטימלי.
#ממה נמנעו מפתחי הדיפ נוסטלגי?
אנשי חברת MyHeritage ומפתחי היישום המלהיב נמנעו מהוספת דיבור לסרטונים.
לאור העובדה שטכנולוגיית הדיפ פייק ידועה ביכולות המטורפות שלה, גם בתחום הדיבור, נשאלת השאלה מדוע. הרי ניתן היה לשתול בפי המצולמים טקסטים מדוברים, שהיו נשמעים אמיתיים, על אף שמעולם לא צולמו והוקלטו.
ראשית, חשוב לומר שזיהוי קולי של המצולמים, ככל שמדובר באנשים שקרוביהם זוכרים עדיין את קולם האמיתי, היה מפחית את אפקט המציאות שיוצרים הסרטונים הללו.
אבל יש עוד סיבה לכך.
ב-MyHeritage מציינת שההימנעות מאפקטים קוליים של דיבור היא מכוונת. מטרתה, הם מטעימים, היא "למנוע שימושים זדוניים בכלי", דוגמת אלה שנעשים בסרטוני "דיפ פייק" של פוליטיקאים וידוענים שעודם בחיים.
לכן הם גם מבקשים מהמשתמשים לעשות בכלי שימוש רק על תמונות היסטוריות השייכות להם ולהימנע משימוש בתמונות של אנשים חיים, שלא אישרו את השימוש הזה.
הסבר לטכנולוגיה (עברית):
https://youtu.be/O4VPN_YjgIM?t=21s
הנה הדיפ נוסטלגיה:
https://youtu.be/tjBYSnoAWqg
ציורים מפורסמים שקמים לתחייה:
https://youtu.be/TWY1uBK4Zxc
ואפילו דיקטטורים קמים לתחיה עם הדיפ נוסטלגיה של מיי הריטג':
https://youtu.be/a-HR03bToew
בשנים האחרונות הולכת ותופסת את מקומה טכנולוגיה מבוססת בינה מלאכותית (AI) שנקראת דיפ פייק (Deepfake). טכנולוגיה זו משמשת לייצור או שינוי תוכן וידאו כך שהיא מציגה מציאות שלמעשה לא התרחשה מעולם. מנאומים שלא ננאמו מעבירים מסרים בדויים מפיהם לכאורה, של אנשים מפורסמים ועד סרטונים "פסאודו-תיעודיים", שמציגים מראות וטקסטים מדוברים, שנראים אמיתיים אך מעולם לא צולמו והוקלטו.
ענף חדש בעולם הדיפ פייק הוא יישום שזכה לשם "דיפ נוסטלגיה" (™Deep Nostalgia), המנפיש את פניהם של אנשים שצולמו בתמונות ישנות או היסטוריות, ומזיז את פניהם, כאילו צולמו בווידאו.
הטכנולוגיה הזו פועלת על כל תמונת סטילס (תמונות קפואות), כולל תמונות בשחור-לבן ותמונות שצולמו בצבע.
השם ניתן ליישום פורץ דרך זה על ידי חברת MyHeritage, שעוסקת בפיתוח טכנולוגיה ליצירת עצי משפחה מקוונים.
סרטוני הדיפ נוסטלגיה התפרסמו כשאנשים שיתפו עם בני משפחתם וחבריהם סרטונים קצרים ומונפשים שנוצרו כך, ובהם קרוביהם ואבותיהם מזיזים את ראשיהם, מצמצים, מחייכים ונעים בצורה ריאליסטית כמעט לחלוטין.
#איך פועלת הדיפ נוסטלגיה?
דיפ נוסטלגיה מחזירה, אם כן, לחיים אנשים שצולמו בצילומי סטילס. זה מתחיל באיתור פני המצולמים בתמונות ואז הפקה של מחוות ותנועות מציאותיות, ממש כאילו צולמו בווידאו. ההנפשה של הפנים בתמונות הסטילס מראה אותם מחייכים, זזים וממצמצים, כאילו צולמו כך במקור.
בבסיס הטכנולוגי של יישום ה"דיפ נוסטלגיה" פועל אלגוריתם למידה עמוקה (Deep Learning), המחבר בין תווי הפנים של המצולמים לבין אוסף מחוות שצולמו בווידאו ושמורים במאגר החברה.
פיתוח וצילום אותן מחוות נעשה כשצילמו אנשי מיי הריטג' מראש שלל מקטעי וידאו של שחקנים ועובדי החברה, המזיזים את ראשיהם ופניהם באורח טבעי, ממצמצים, מחייכים ומפנים את ראשם לכיוונים שונים.
למעשה שכרה חברת MyHeritage רישיון מחברת D-ID, לטכנולוגיה שפותחה בה ומאפשרת שחזור, באמצעות טכנולוגיית למידה עמוקה, של סרטוני וידאו.
על מנת שאפקט ההנפשה יופעל על התמונות, ברזולוציה הכי גבוהה האפשרית, עוברות תמונות מטושטשות חידוד אוטומטי, שמבצעת הטכנולוגיה החדשנית, מה שמעלה באופן דרמטי את איכות הסרטונים המופקים בה.
ההברקה האמיתית של הטכנולוגיה הזו נעוצה בזיהוי והבחירה האוטומטית שמבצע יישום הדיפ נוסטלגיה, מבין מקטעי המחוות בווידאו. ניתוח מהיר של מנח הראש וכיוון העיניים של המצולמים בתמונה מאפשרים ליישום להתאים להם באופן חכם את מחוללי ההנפשה המיטביים ולייצר את הסרטונים המונפשים באופן אופטימלי.
#ממה נמנעו מפתחי הדיפ נוסטלגי?
אנשי חברת MyHeritage ומפתחי היישום המלהיב נמנעו מהוספת דיבור לסרטונים.
לאור העובדה שטכנולוגיית הדיפ פייק ידועה ביכולות המטורפות שלה, גם בתחום הדיבור, נשאלת השאלה מדוע. הרי ניתן היה לשתול בפי המצולמים טקסטים מדוברים, שהיו נשמעים אמיתיים, על אף שמעולם לא צולמו והוקלטו.
ראשית, חשוב לומר שזיהוי קולי של המצולמים, ככל שמדובר באנשים שקרוביהם זוכרים עדיין את קולם האמיתי, היה מפחית את אפקט המציאות שיוצרים הסרטונים הללו.
אבל יש עוד סיבה לכך.
ב-MyHeritage מציינת שההימנעות מאפקטים קוליים של דיבור היא מכוונת. מטרתה, הם מטעימים, היא "למנוע שימושים זדוניים בכלי", דוגמת אלה שנעשים בסרטוני "דיפ פייק" של פוליטיקאים וידוענים שעודם בחיים.
לכן הם גם מבקשים מהמשתמשים לעשות בכלי שימוש רק על תמונות היסטוריות השייכות להם ולהימנע משימוש בתמונות של אנשים חיים, שלא אישרו את השימוש הזה.
הסבר לטכנולוגיה (עברית):
https://youtu.be/O4VPN_YjgIM?t=21s
הנה הדיפ נוסטלגיה:
https://youtu.be/tjBYSnoAWqg
ציורים מפורסמים שקמים לתחייה:
https://youtu.be/TWY1uBK4Zxc
ואפילו דיקטטורים קמים לתחיה עם הדיפ נוסטלגיה של מיי הריטג':
https://youtu.be/a-HR03bToew
מהם צעצועי הבינה המלאכותית?
CogniToys היא סדרת צעצועים לילדים שמשתמשת בבינה מלאכותית כדי שהילדים יוכלו לנהל שיחות עם הצעצועים שלהם. הילד או הפעוט יגדל ביחד עם הצעצועים שלו והצעצועים יתפתחו וילמדו במקביל לילד. הצעצועים פותחו בשיתוף פעולה בין חברה אמריקאית בשם Elemental Path וחברת IBM, שהעמידה את ווטסון, מחשב העל שלה, שהביס אלופי שחמט וזכה בשעשועוני טלוויזיה נחשבים, למול גאונים אנושיים.
הדינוזאור של קוגניטויז יקריא לילד סיפור מהמאגר העצום של ווטסון, יענה לו על שאלות, יחבר איתו סיפורים חדשים, יכיר אותו ואת תחומי העניין שלו, מה מצחיק אותו ומה הוא אוהב לעשות. כשהילד יתבגר, הצעצוע יסייע לילד ללמוד ולתרגל חשבון, איות של מילים, חריזה של שירים, אוצר מילים ועוד.
מחשב הווטסון, פעם מחשב-על בגודל של חדר, הוא כיום שירות ענן שהצעצועים מתחברים אליו דרך האינטרנט. כדי ליצור קשר עם הבינה המלאכותית יש צורך בחיבור קבוע לרשת האינטרנט, אך התמורה היא שצעצועי הקוגניטויז הם חכמים בהרבה מכל צעצוע אחר בעולם.
הנה הצעצועים החכמים של קוגני טויז:
http://youtu.be/e5zhSWvB-CY?t=1m5s
ומגוון הצעצועים התבוניים של קוגני טויז:
http://youtu.be/o1tm5Xs5vIw
CogniToys היא סדרת צעצועים לילדים שמשתמשת בבינה מלאכותית כדי שהילדים יוכלו לנהל שיחות עם הצעצועים שלהם. הילד או הפעוט יגדל ביחד עם הצעצועים שלו והצעצועים יתפתחו וילמדו במקביל לילד. הצעצועים פותחו בשיתוף פעולה בין חברה אמריקאית בשם Elemental Path וחברת IBM, שהעמידה את ווטסון, מחשב העל שלה, שהביס אלופי שחמט וזכה בשעשועוני טלוויזיה נחשבים, למול גאונים אנושיים.
הדינוזאור של קוגניטויז יקריא לילד סיפור מהמאגר העצום של ווטסון, יענה לו על שאלות, יחבר איתו סיפורים חדשים, יכיר אותו ואת תחומי העניין שלו, מה מצחיק אותו ומה הוא אוהב לעשות. כשהילד יתבגר, הצעצוע יסייע לילד ללמוד ולתרגל חשבון, איות של מילים, חריזה של שירים, אוצר מילים ועוד.
מחשב הווטסון, פעם מחשב-על בגודל של חדר, הוא כיום שירות ענן שהצעצועים מתחברים אליו דרך האינטרנט. כדי ליצור קשר עם הבינה המלאכותית יש צורך בחיבור קבוע לרשת האינטרנט, אך התמורה היא שצעצועי הקוגניטויז הם חכמים בהרבה מכל צעצוע אחר בעולם.
הנה הצעצועים החכמים של קוגני טויז:
http://youtu.be/e5zhSWvB-CY?t=1m5s
ומגוון הצעצועים התבוניים של קוגני טויז:
http://youtu.be/o1tm5Xs5vIw
מהי מכונת טיורינג?
מכונת טיורינג (Turing machine) היא רעיון לאופן פעולה של מחשב, שהציע אלן טיורינג בשנת 1936, עוד לפני המצאת המחשב עצמו. הוא ניסה אז להגדיר באופן מתמטי מהו אלגוריתם, "תהליך מכני".
המודל שהציע טיורינג נקרא כמובן על שמו - מכונת טיורינג. המכונה כוללת ראש בעל זיכרון סופי שיכול לקרוא תוכן של תא שמעליו הוא ממוקם, על גבי סרט אינסופי של תאים. הראש יכול לכתוב במקום זה, או לנוע ימינה ושמאלה.
הנה סרטון שמסביר את מכונת טיורינג ומדגים את הרעיון שלה:
http://youtu.be/1uDa7jkIztw
כך פועלת מכונת טיורינג:
http://youtu.be/mU8oiAbom0I
ודגם של המכונה שנבנה מלגו:
http://youtu.be/qc1C1Q0xFIM
מכונת טיורינג (Turing machine) היא רעיון לאופן פעולה של מחשב, שהציע אלן טיורינג בשנת 1936, עוד לפני המצאת המחשב עצמו. הוא ניסה אז להגדיר באופן מתמטי מהו אלגוריתם, "תהליך מכני".
המודל שהציע טיורינג נקרא כמובן על שמו - מכונת טיורינג. המכונה כוללת ראש בעל זיכרון סופי שיכול לקרוא תוכן של תא שמעליו הוא ממוקם, על גבי סרט אינסופי של תאים. הראש יכול לכתוב במקום זה, או לנוע ימינה ושמאלה.
הנה סרטון שמסביר את מכונת טיורינג ומדגים את הרעיון שלה:
http://youtu.be/1uDa7jkIztw
כך פועלת מכונת טיורינג:
http://youtu.be/mU8oiAbom0I
ודגם של המכונה שנבנה מלגו:
http://youtu.be/qc1C1Q0xFIM
איך לדעת מתי אנו משוחחים עם טכנולוגיה תבונית?
ניתן להצמיד את התוספת של בינה מלאכותית או אינטליגנציה מלאכותית לכל תוכנה או מחשב, אבל יש לדעת שיש הגדרה מדויקת ומדידה, שרק מחשבים או תוכנות שעומדים בה יכולים להיקרא "מחשבים חכמים".
ההגדרה הידועה ביותר למהי בינה מלאכותית ידועה בשם 'מבחן טיורינג'. לפי מבחן זה מחשב ייחשב לבעל תבונה, אם אדם שינהל עמו שיחה, בדרך שאינה מסגירה אם זה מחשב או בן-אנוש (בממשק כמו צ'אט ממוחשב למשל), לא יוכל לזהות האם מולו ניצב אדם או מכונה.
בשנת 2014 עמדה לראשונה תוכנת מחשב במבחן טיורינג, כשהצליחה לעבור את סף 30% מהמשוחחים שחשבו שהם שוחחו עם בן-אדם.
עוד על הנושא אפשר ללמוד באאוריקה, בתגית "מבחן טיורינג".
הנה הסבר פשוט לגבי מבחן טיורינג (עברית):
http://youtu.be/YTNasDfDE6U?t=1m8s
רובוטים כמו ג'ולס, שיכולים לנהל שיחה, הם העתיד של הבינה המלאכותית:
https://youtu.be/IhVu2hxm07E
והסבר על מבחן טיורינג כאמצעי לזיהוי תבונת מחשב (מתורגם):
https://youtu.be/3wLqsRLvV-c
ניתן להצמיד את התוספת של בינה מלאכותית או אינטליגנציה מלאכותית לכל תוכנה או מחשב, אבל יש לדעת שיש הגדרה מדויקת ומדידה, שרק מחשבים או תוכנות שעומדים בה יכולים להיקרא "מחשבים חכמים".
ההגדרה הידועה ביותר למהי בינה מלאכותית ידועה בשם 'מבחן טיורינג'. לפי מבחן זה מחשב ייחשב לבעל תבונה, אם אדם שינהל עמו שיחה, בדרך שאינה מסגירה אם זה מחשב או בן-אנוש (בממשק כמו צ'אט ממוחשב למשל), לא יוכל לזהות האם מולו ניצב אדם או מכונה.
בשנת 2014 עמדה לראשונה תוכנת מחשב במבחן טיורינג, כשהצליחה לעבור את סף 30% מהמשוחחים שחשבו שהם שוחחו עם בן-אדם.
עוד על הנושא אפשר ללמוד באאוריקה, בתגית "מבחן טיורינג".
הנה הסבר פשוט לגבי מבחן טיורינג (עברית):
http://youtu.be/YTNasDfDE6U?t=1m8s
רובוטים כמו ג'ולס, שיכולים לנהל שיחה, הם העתיד של הבינה המלאכותית:
https://youtu.be/IhVu2hxm07E
והסבר על מבחן טיורינג כאמצעי לזיהוי תבונת מחשב (מתורגם):
https://youtu.be/3wLqsRLvV-c
מה זה אג'נטיק AI?
בינה מלאכותית אג'נטית (Agentic Al) היא סוג של בינה מלאכותית שמשלבת את מודלי השפה, כמו ה-GPT, עם כלי פיתוח, ידע ופעולות שנועדו לאפשר בנייה של "סוכנים בינתיים" (AI agent) שיסייעו לנו במשימות שונות.
המושג הזה והכלים המיועדים עבור Agentic Al מכוונים בדרך כלל למתכנתים. אך לעולם של בניית סוכני AI הולכים ונכנסים, ללא כתיבת קוד, גם מי שאינם מתכנתים.
נזכיר שאותם סוכני AI שהאג'נטיק AI מאפשר הם כבר לא לאו דווקא מודלי שפה כלליים שעושים או יודעים לעשות הכל, כמו ה-LLMים הגדולים, אלא מנועים מתמחים, מתוכנתים עם יעדים ברורים ומכוונים לביצוע של משימות ספציפיות, עבור אנשים פרטיים או לארגונים ועסקים.
כי בניגוד למנועי השפה הגדולים (LLM) שהתמחו בהמלצות, עזרה וחשיבה, אבל בעיקר בטקסט, הסוכנים החכמים יכולים לעשות וממש עושים פעולות בעולם האמיתי ומהחיים עצמם - הם מתכנתים, בונים אתרים, משווקים, יוצרים תוכן, משרתים לקוחות, נותנים תמיכה ושירות, מעדכנים גיליון אלקטרוני, נותנים תמיכה טכנית, עונים לאימיילים, קונים מוצרים ועוד המון.
#שלוש תכונות בסיס יש לסוכני AI:
אוטונומיה - שמשמעותה פעילות ללא צורך מתמיד בהנחיה אנושית.
סתגלנות - יכולתם ללמוד מהאינטראקציות שלהם ולהגדיר מחדש את האלגוריתמים שלהם על סמך הידע שרכשו.
מכוונות למטרה - הם מתוכנתים להשגת יעדים ברורים, כמו נהיגה ברכב אוטונומי, טיפול במיילים שלנו, או תזמון פגישות.
#אג'נטיק AI בתעשיה
בחברות ענק מפתחים כל הזמן סוכנים חכמים שיכולים לבצע משימות, בפיקוח של מנהלים וראשי צוותים כמובן. אלה מערכות אוטונומיות ואג'נטיות, מבוססות בינה מלאכותית, המסוגלות לבצע משימות מורכבות, ממש כמו "מערכות המומחה", שמדענים חלמו עליהן בשנות ה-80 המאוחרות ומתגשמות עכשיו כסוכני בינה מלאכותית (AI Agents) שעובדים על סטרואידים.
אותם סוכנים, מבוססי בינה מלאכותית, ממש עובדים בשביל החברה וכבר בהתחלה משתמשים בכלים יומיומיים כמו Gmail, Salesforce, Office365, Google Sheets ועוד. הם מקבלים משימות מורכבות, מסוגלים לפרקן לתתי-משימות ולחלק את העבודה על ידי שיוך כל תת-משימה כזו לסוכן ה-AI המתאים ביותר לבצעה. כך ניתן לקבל את הפתרונות המתאימים ביותר גם למשימות מורכבות ביותר.
#עתיד מרובה סוכנים
השלב הבא הוא כמובן שלב החיבור של מספר סוכנים ועובדים חכמים שכאלה, לעבודה משותפת ומילוי משימות משותף. כי אחת היכולות המשמעותיות ביותר של סוכן AI היא לתקשר ולשתף פעולה עם מערכות AI אחרות, לצד תשתיות דיגיטליות. זה מה שמאפשר גישה משולבת ויעילה יותר, למשל לפתרון בעיות וניהול משימות בבית. זה נקרא בתעשייה "מערכות מרובות סוכנים" (Multi-Agent Systems).
דמיינו שרשרת של מכונות חכמות הפועלות כמו משרד אנושי, בו לכל עובד יש התמחות ותפקיד תואם. השלם בה הוא גדול מסכום חלקיו, קצת כמו הקובוטים (Cobots), עדרי הרובוטים המסונכרנים להפליא, שעובדים במחסני ומרכזי השילוח של Amazon.
מהחזון האג'נטי הזה קל לדמיין כיצד קם ז'אנר חדש ואולטרה מודרני של עסקים. אלה מפעלים תעשייתיים, וירטואליים לחלוטין, כמעט ללא בני אדם, או עם בני האדם המפקחים ומנהלים את הבינות, כשהם מייצרים בקבוצות קטנות את מה שבעבר חייב מאות או אלפי עובדים ויותר.
זה העתיד והוא מתחיל עכשיו. אג'נטיק AI מבטיח בפשטות שאם פעם השמיים היו הגבול, היום האופק הוא השמיים ואת הגבול לא ניתן לראות.
הנה הסבר על Agentic AI:
https://youtu.be/-pqzyvRp3Tc
אלה הם סוכני AI:
https://youtu.be/Fyo6vnM8BBk
כך יוצרים סוכן AI ב-Claude בתחילת 2025:
https://youtu.be/amCjKc9O_Bo
Windsurf האג'נטי הוא סוכן AI שמייצר קוד לתוכנות ואתרים:
https://youtu.be/pOvI02of5oo
הבשלת היכולות של סוכנים חכמים מבוססי AI היא תוצאה של התפתחות אדירה. הנה "Do Browser" שיודע לתת לנו שירות מופלא אונליין:
https://youtu.be/vMFWeCMrFNU
וזה החזון המבהיל או מבטיח - תאגיד של אחד או אחת:
https://youtu.be/6EGqLE0Y6Z0?long=yes
בינה מלאכותית אג'נטית (Agentic Al) היא סוג של בינה מלאכותית שמשלבת את מודלי השפה, כמו ה-GPT, עם כלי פיתוח, ידע ופעולות שנועדו לאפשר בנייה של "סוכנים בינתיים" (AI agent) שיסייעו לנו במשימות שונות.
המושג הזה והכלים המיועדים עבור Agentic Al מכוונים בדרך כלל למתכנתים. אך לעולם של בניית סוכני AI הולכים ונכנסים, ללא כתיבת קוד, גם מי שאינם מתכנתים.
נזכיר שאותם סוכני AI שהאג'נטיק AI מאפשר הם כבר לא לאו דווקא מודלי שפה כלליים שעושים או יודעים לעשות הכל, כמו ה-LLMים הגדולים, אלא מנועים מתמחים, מתוכנתים עם יעדים ברורים ומכוונים לביצוע של משימות ספציפיות, עבור אנשים פרטיים או לארגונים ועסקים.
כי בניגוד למנועי השפה הגדולים (LLM) שהתמחו בהמלצות, עזרה וחשיבה, אבל בעיקר בטקסט, הסוכנים החכמים יכולים לעשות וממש עושים פעולות בעולם האמיתי ומהחיים עצמם - הם מתכנתים, בונים אתרים, משווקים, יוצרים תוכן, משרתים לקוחות, נותנים תמיכה ושירות, מעדכנים גיליון אלקטרוני, נותנים תמיכה טכנית, עונים לאימיילים, קונים מוצרים ועוד המון.
#שלוש תכונות בסיס יש לסוכני AI:
אוטונומיה - שמשמעותה פעילות ללא צורך מתמיד בהנחיה אנושית.
סתגלנות - יכולתם ללמוד מהאינטראקציות שלהם ולהגדיר מחדש את האלגוריתמים שלהם על סמך הידע שרכשו.
מכוונות למטרה - הם מתוכנתים להשגת יעדים ברורים, כמו נהיגה ברכב אוטונומי, טיפול במיילים שלנו, או תזמון פגישות.
#אג'נטיק AI בתעשיה
בחברות ענק מפתחים כל הזמן סוכנים חכמים שיכולים לבצע משימות, בפיקוח של מנהלים וראשי צוותים כמובן. אלה מערכות אוטונומיות ואג'נטיות, מבוססות בינה מלאכותית, המסוגלות לבצע משימות מורכבות, ממש כמו "מערכות המומחה", שמדענים חלמו עליהן בשנות ה-80 המאוחרות ומתגשמות עכשיו כסוכני בינה מלאכותית (AI Agents) שעובדים על סטרואידים.
אותם סוכנים, מבוססי בינה מלאכותית, ממש עובדים בשביל החברה וכבר בהתחלה משתמשים בכלים יומיומיים כמו Gmail, Salesforce, Office365, Google Sheets ועוד. הם מקבלים משימות מורכבות, מסוגלים לפרקן לתתי-משימות ולחלק את העבודה על ידי שיוך כל תת-משימה כזו לסוכן ה-AI המתאים ביותר לבצעה. כך ניתן לקבל את הפתרונות המתאימים ביותר גם למשימות מורכבות ביותר.
#עתיד מרובה סוכנים
השלב הבא הוא כמובן שלב החיבור של מספר סוכנים ועובדים חכמים שכאלה, לעבודה משותפת ומילוי משימות משותף. כי אחת היכולות המשמעותיות ביותר של סוכן AI היא לתקשר ולשתף פעולה עם מערכות AI אחרות, לצד תשתיות דיגיטליות. זה מה שמאפשר גישה משולבת ויעילה יותר, למשל לפתרון בעיות וניהול משימות בבית. זה נקרא בתעשייה "מערכות מרובות סוכנים" (Multi-Agent Systems).
דמיינו שרשרת של מכונות חכמות הפועלות כמו משרד אנושי, בו לכל עובד יש התמחות ותפקיד תואם. השלם בה הוא גדול מסכום חלקיו, קצת כמו הקובוטים (Cobots), עדרי הרובוטים המסונכרנים להפליא, שעובדים במחסני ומרכזי השילוח של Amazon.
מהחזון האג'נטי הזה קל לדמיין כיצד קם ז'אנר חדש ואולטרה מודרני של עסקים. אלה מפעלים תעשייתיים, וירטואליים לחלוטין, כמעט ללא בני אדם, או עם בני האדם המפקחים ומנהלים את הבינות, כשהם מייצרים בקבוצות קטנות את מה שבעבר חייב מאות או אלפי עובדים ויותר.
זה העתיד והוא מתחיל עכשיו. אג'נטיק AI מבטיח בפשטות שאם פעם השמיים היו הגבול, היום האופק הוא השמיים ואת הגבול לא ניתן לראות.
הנה הסבר על Agentic AI:
https://youtu.be/-pqzyvRp3Tc
אלה הם סוכני AI:
https://youtu.be/Fyo6vnM8BBk
כך יוצרים סוכן AI ב-Claude בתחילת 2025:
https://youtu.be/amCjKc9O_Bo
Windsurf האג'נטי הוא סוכן AI שמייצר קוד לתוכנות ואתרים:
https://youtu.be/pOvI02of5oo
הבשלת היכולות של סוכנים חכמים מבוססי AI היא תוצאה של התפתחות אדירה. הנה "Do Browser" שיודע לתת לנו שירות מופלא אונליין:
https://youtu.be/vMFWeCMrFNU
וזה החזון המבהיל או מבטיח - תאגיד של אחד או אחת:
https://youtu.be/6EGqLE0Y6Z0?long=yes
האם מחשב יכול להיות ממציא?
המצאה, או יצירה ממוחשבת (Computer creation), על ידי מכונות יוצרות, או ליתר דיוק תוכנות שיוצרות, היא פנטזיה של רבים מהמפתחים.
אם מחשבים יוכלו להמציא וליצור דברים חדשים לחלוטין, יתכן שתהיה כאן מכפלה מטורפת, אם כל המהפכות, משהו שלידו ייראו המהפכה המדעית של 500 השנים האחרונות, המהפכה התעשייתית, המהפכה הטכנולוגית ומהפכת המידע והאינטרנט - כמו שלל משחקי ילדים משעשעים.
דמיינו מאות ואלפי מחשבים משוכללים במיוחד ש"יישבו" לפתור את הבעיות שעומדות בפני המין האנושי ויתמקדו במה שהממציאים והמדענים ניסו לעשות במשך מאות או אלפי שנים, מאז החלה התרבות האנושית וגם לפניה, בעידן הפרהיסטורי.
אז כן. מחשבים יכולים תאורטית להמציא וליצור. וזו תהיה אחת המהפכות הבאות בעולם המחשוב. היא תתרחש כשהמחשב יוכל ממש לחשוב וממש להמציא דבר מה חדש, פתרון לבעיה, משהו שלא קיבל הוראות כיצד לבצע, אלא שנבע מתהליך חשיבה שהוא הוביל, אולי אפילו יזם.
הרי כל ההתפתחות האנושית החלה כשאנו, בני האדם, התחלנו להשתחרר מאותן מגבלות ביולוגיות שמגבילות אותנו. כל המצאה שחררה אותנו ממגבלה אחרת, מעיקה ומקשה על חיים נוחים יותר, בריאים ומהנים יותר.
דוגמאות? - לא חסר. השימוש באש אפשר לנו להפוך את המזון לקל יותר לעיכול וטעים יותר. הקירור איפשר לו לשרוד זמן רב יותר ולשמש אותנו כשאנו צריכים אותו ולא רק כשהוא זמין לנו. הבגדים שחררו אותנו מהקור, החיות המבויתות היו מכפלת כוח לחקלאות, ייצור ותחבורה. החקלאות שימשה לייצור של מזון בכמויות שאפשרו את צמיחת האנושות ושחרור ממגבלות הליקוט, הבתים שימשו למגורים במקומות הפוריים ולא רק במקומות שבהם יש מערות וכך הלאה.
עוד? - הגלגל שימש לייצור של מכונות רבות כוח ובעלות יכולת מכנית מדהימה, הערים יצרו לנו בטחון רב יותר והגנה מפני השבט השכן או משודדי דרכים שישדדו את מזוננו. כתב שימש אותנו לתקשורת והעברת הידע האנושי לאחרים, או לשימורו ולהעברתו מדור לדור. הדפוס הפיץ את הידע ויצר את ההשכלה, כך שהיא יצאה משליטתם של בעלי הממון והכוח בלבד. האנרגיה החשמלית, התעשייה והקיטור הניעו את המהפכה התעשייתית, בעוד מכשירי החשמל משרתים אותנו, המטוסים נושאים אותנו לכל פינה על פני כדור הארץ, החלליות אל החלל, חיסונים, תרופות, ניתוחים והשתלות שומרים את בריאותנו ומשמרים את גופנו לשנים רבות יותר...
ואלה רק דוגמאות בולטות.
אז כן. דמיינו מה ימציאו ואילו בעיות יוכלו לפתור מחשבים, שיהיו בעלי ידע בכל התחומים, ידע בפיזיקה, כימיה, רובוטיקה, ננוטכנולוגיה, ביוטכנולוגיה וכמובן מתמטיקה. דמיינו אילו בעיות בחיינו הם יוכלו לפתור עם הידע שיוזרם אליהם מכל קצוות המדע, הטכנולוגיה והפטנטים - ידע שבניגוד למדענים אנושיים, הם לא יוכלו לשכוח או להשמיט בהיסח הדעת, ידע שפרטיו יתחברו וייבדקו במיליארדי אפשרויות, איטרציות וקומבינציות ויוצלבו בביליוני דרכים, כך שחלק גדול ממה שהיום קורה בהברקה של רגע, או אפילו בזכות טעות שמביאה להמצאה - כל אלה יוכלו לקרות באמצעות חישוביות מאורגנת, שיטתיות ומסודרת וכמובן, מיחשוב מתוכנת היטב.
כל זה יקרה באמצעות אינטליגנציה מלאכותית, ודאי גם הבזקית, שחושבת פחות או יותר כמו ממציא, אבל בראש ובראשונה, בינה מלאכותית בעלת יכולות שיטתיות, סדרתיות, כמותיות בטירוף, שלא מאבדות או מפספסות דבר.
הרעיון של מחשב כזה, או תוכנה כזו, שימציאו או ישתמשו ביצירתיות מלאכותית, הוא ליצור מודל של המצאה, של קומפוזיציה ושל יצירה כמו אנושית. מודל כזה שניתן יהיה למחשב, או להזין כאלגוריתם לתוכנה, שתשחזר את התהליך. זה אפשרי ולכן אפשרית גם תוכנה שתמציא ותפתור בעיות קשות ברמה של מדענים וממציאים.
השאלה היא רק מתי זה יקרה.
הנה חקר האזורים והתהליכים במוח שקשורים ביצירתיות ויתרון בני האדם על המכונה (עברית):
https://youtu.be/jFwHEnjIy7c
מבחן לאבלייס והאפשרות שמכונה יוצרת תוכל להמציא רעיונות אמנותיים בעצמה (מתורגם):
https://youtu.be/Rh9vBczqMk0
דיון על האפשרות שמחשבים יצרו בעצמם:
https://youtu.be/Sbd4NX95Ysc?long=yes
הרצאה על איך גורמים למחשבים להיות יצירתיים:
https://youtu.be/uSUOdu_5MPc?long=yes
והרצאת טד נהדרת על התקופה המרובדת שבפיתחה אנו ניצבים (מתורגם):
https://youtu.be/aR5N2Jl8k14?long=yes
המצאה, או יצירה ממוחשבת (Computer creation), על ידי מכונות יוצרות, או ליתר דיוק תוכנות שיוצרות, היא פנטזיה של רבים מהמפתחים.
אם מחשבים יוכלו להמציא וליצור דברים חדשים לחלוטין, יתכן שתהיה כאן מכפלה מטורפת, אם כל המהפכות, משהו שלידו ייראו המהפכה המדעית של 500 השנים האחרונות, המהפכה התעשייתית, המהפכה הטכנולוגית ומהפכת המידע והאינטרנט - כמו שלל משחקי ילדים משעשעים.
דמיינו מאות ואלפי מחשבים משוכללים במיוחד ש"יישבו" לפתור את הבעיות שעומדות בפני המין האנושי ויתמקדו במה שהממציאים והמדענים ניסו לעשות במשך מאות או אלפי שנים, מאז החלה התרבות האנושית וגם לפניה, בעידן הפרהיסטורי.
אז כן. מחשבים יכולים תאורטית להמציא וליצור. וזו תהיה אחת המהפכות הבאות בעולם המחשוב. היא תתרחש כשהמחשב יוכל ממש לחשוב וממש להמציא דבר מה חדש, פתרון לבעיה, משהו שלא קיבל הוראות כיצד לבצע, אלא שנבע מתהליך חשיבה שהוא הוביל, אולי אפילו יזם.
הרי כל ההתפתחות האנושית החלה כשאנו, בני האדם, התחלנו להשתחרר מאותן מגבלות ביולוגיות שמגבילות אותנו. כל המצאה שחררה אותנו ממגבלה אחרת, מעיקה ומקשה על חיים נוחים יותר, בריאים ומהנים יותר.
דוגמאות? - לא חסר. השימוש באש אפשר לנו להפוך את המזון לקל יותר לעיכול וטעים יותר. הקירור איפשר לו לשרוד זמן רב יותר ולשמש אותנו כשאנו צריכים אותו ולא רק כשהוא זמין לנו. הבגדים שחררו אותנו מהקור, החיות המבויתות היו מכפלת כוח לחקלאות, ייצור ותחבורה. החקלאות שימשה לייצור של מזון בכמויות שאפשרו את צמיחת האנושות ושחרור ממגבלות הליקוט, הבתים שימשו למגורים במקומות הפוריים ולא רק במקומות שבהם יש מערות וכך הלאה.
עוד? - הגלגל שימש לייצור של מכונות רבות כוח ובעלות יכולת מכנית מדהימה, הערים יצרו לנו בטחון רב יותר והגנה מפני השבט השכן או משודדי דרכים שישדדו את מזוננו. כתב שימש אותנו לתקשורת והעברת הידע האנושי לאחרים, או לשימורו ולהעברתו מדור לדור. הדפוס הפיץ את הידע ויצר את ההשכלה, כך שהיא יצאה משליטתם של בעלי הממון והכוח בלבד. האנרגיה החשמלית, התעשייה והקיטור הניעו את המהפכה התעשייתית, בעוד מכשירי החשמל משרתים אותנו, המטוסים נושאים אותנו לכל פינה על פני כדור הארץ, החלליות אל החלל, חיסונים, תרופות, ניתוחים והשתלות שומרים את בריאותנו ומשמרים את גופנו לשנים רבות יותר...
ואלה רק דוגמאות בולטות.
אז כן. דמיינו מה ימציאו ואילו בעיות יוכלו לפתור מחשבים, שיהיו בעלי ידע בכל התחומים, ידע בפיזיקה, כימיה, רובוטיקה, ננוטכנולוגיה, ביוטכנולוגיה וכמובן מתמטיקה. דמיינו אילו בעיות בחיינו הם יוכלו לפתור עם הידע שיוזרם אליהם מכל קצוות המדע, הטכנולוגיה והפטנטים - ידע שבניגוד למדענים אנושיים, הם לא יוכלו לשכוח או להשמיט בהיסח הדעת, ידע שפרטיו יתחברו וייבדקו במיליארדי אפשרויות, איטרציות וקומבינציות ויוצלבו בביליוני דרכים, כך שחלק גדול ממה שהיום קורה בהברקה של רגע, או אפילו בזכות טעות שמביאה להמצאה - כל אלה יוכלו לקרות באמצעות חישוביות מאורגנת, שיטתיות ומסודרת וכמובן, מיחשוב מתוכנת היטב.
כל זה יקרה באמצעות אינטליגנציה מלאכותית, ודאי גם הבזקית, שחושבת פחות או יותר כמו ממציא, אבל בראש ובראשונה, בינה מלאכותית בעלת יכולות שיטתיות, סדרתיות, כמותיות בטירוף, שלא מאבדות או מפספסות דבר.
הרעיון של מחשב כזה, או תוכנה כזו, שימציאו או ישתמשו ביצירתיות מלאכותית, הוא ליצור מודל של המצאה, של קומפוזיציה ושל יצירה כמו אנושית. מודל כזה שניתן יהיה למחשב, או להזין כאלגוריתם לתוכנה, שתשחזר את התהליך. זה אפשרי ולכן אפשרית גם תוכנה שתמציא ותפתור בעיות קשות ברמה של מדענים וממציאים.
השאלה היא רק מתי זה יקרה.
הנה חקר האזורים והתהליכים במוח שקשורים ביצירתיות ויתרון בני האדם על המכונה (עברית):
https://youtu.be/jFwHEnjIy7c
מבחן לאבלייס והאפשרות שמכונה יוצרת תוכל להמציא רעיונות אמנותיים בעצמה (מתורגם):
https://youtu.be/Rh9vBczqMk0
דיון על האפשרות שמחשבים יצרו בעצמם:
https://youtu.be/Sbd4NX95Ysc?long=yes
הרצאה על איך גורמים למחשבים להיות יצירתיים:
https://youtu.be/uSUOdu_5MPc?long=yes
והרצאת טד נהדרת על התקופה המרובדת שבפיתחה אנו ניצבים (מתורגם):
https://youtu.be/aR5N2Jl8k14?long=yes
למה אנחנו פוחדים מרובוטים?
החשש או הפחד מרובוטים הוא אחד הגורמים הקבועים בתולדות הטכנולוגיה. למעשה שורשיו מצויים כבר הרבה קודם בתרבות האנושית, בסיפורים כמו "הגולם" על יצור מעשה אדם היוצא משליטה וב"פרנקנשטיין" שעלילתו דומה גם היא.
החשש כיום הוא פחות מצבאות רובוטים שישתלטו על העולם, במרד רובוטים עוינים בנוסח הסרטים של ארנולד שוורצנגר, או מרובוט כמו "האל", מהסרט האמריקאי משנת 1968 "2001: אודיסיאה בחלל", שמסרב לציית, לאחר שנעשה מודע והפך פסיכוטי ובהדרגה משתלט על ספינת חלל ומתחיל להרוג את אנשי הצוות.
המדענים והמומחים חרדים יותר מיצירת רובוטים שיהיו מאד אינטליגנטיים ובעלי יכולות השפעה עצומות על חיינו, אך במקביל חסרי רגשות וערכים, שיהיו אדישים למה שנחשב ראוי וקדוש בחברה האנושית, לחיי אדם, תפיסות מוסריות וכדומה.
נקצין רגע ונניח שרובוטים עתידיים ימונו לנהל מערכת פיננסית או כלכלית בעתיד. מה למשל יקרה אם הרובוטים שאמונים על הכלכלה בעולם שכזה יגיעו למסקנה שיעיל יותר לא להאכיל חצי עולם ופשוט לתת לו למות, כדי שלחצי השני יהיו חיים טובים? - זו החלטה יעילה וקרה שלא פעם התקבלה על ידי ניצולים, שהעדיפו לאפשר לחלקם לחיות, גם אם מחיר ההישרדות הוא חיי אדם של האחרים. מי ערב לנו ש"שואה יעילה" כזו לא תוכל להתקיים בעתיד בחסות הבינה הרובוטית?
הבעיה הגדולה כרגע היא שלמומחי הרובוטיקה הטובים ביותר אין שמץ של מושג איך מייצרים רובוט שמרגיש, מתלבט, מטיל ספק ובוחר באופציה הלאו דווקא יותר יעילה, אבל יותר מוסרית, רגישה או מתחשבת יותר.
בלשון פשוטה ניתן לומר שהבינה המלאכותית הגיעה לשלב שבו היא יודעת לתכנת יעילות, למזער נזקים ולשפר ביצועים, אבל היא רחוקה מיצירת רובוטים שפשוט יבקשו סליחה... ניתן בקלות לתכנת בקשת סליחה של רובוט, אבל החוכמה היא שהיא תבוא לאחר שהרובוט הבין את הפגם המוסרי בהתנהגותו ולא מפני שהוא זיהה בראייה ממוחשבת דמעות בעיניים של בן שיחו, יכולות שסוגלו לרובוטים מתקדמים כמו הרובוטית סופיה, הידועה ב"רגשות" שהיא מפגינה.
אז אולי נוכל לנתק את הרובוט מהחשמל? - ודאי עלתה מחשבה כזו בראשכם. כן ולא. בהתחלה זה אכן יהיה אמצעי אבטחה יעיל, אבל בשלב מסוים יפתחו בני-אדם רובוט שבכוונה לא ניתן יהיה לכבותו, כדי שיבצע את תפקידו מבלי שבני-אדם יפריעו לו. ככל שהרובוטים יהיו טובים יותר ובעלי יכולות טובות משלנו במילוי התפקידים שלהם, הרגע הזה של רובוט שלא ניתן לנתקו יתקרב. היעילות האנושית מבטיחה שהוא יגיע.
אגב, לא בכל העולם החשש הזה קיים. בעוד שבמערב הרובוטים נתפסים כבעלי פוטנציאל להרס, משהו מפחיד שעלול להפוך הרסני בעתיד, ביפאן ממש אוהבים אותם. אצלם אין שום חשש מהרובוטים והתפיסה המקובלת היא שהם די חמודים. אולי זו הסיבה שבזמן שבאמריקה מפתחים רובוטים צבאיים, היפאנים חוגגים את החיים בפיתוח של רובוטים חמדמדים, כמו כלבי רובוט עם זנבות דיגיטליים ועד הומנואידים שמחקים בני אדם, רוקדים, שרים וחיים את החיים.
הנה החששות מהבינה המלאכותית של הרובוטים הללו (עברית):
https://youtu.be/7qUJRUA0wm0?t=17s
בסרט "אדוננו הרובוט" רואים את תסריט הקצה של שליטה רובוטית במין האנושי כולו (מתורגם):
https://youtu.be/Qbjz5wFBovs
אוסף שמדגים כיצד הקולנוע והספרות הציתו את הפחד הגדול מהרובוטים הנבונים (עברית):
https://youtu.be/bqVwLXo2_3I
הדגמה של מצב הבינה המלאכותית:
https://youtu.be/poLZqn2_dv4
מסתבר שגם גורילות לא מתמסרות בקלות לרובוט גורילה:
https://youtu.be/podn2Szo1ls
וסרט תיעודי על הרובוטים ועל האופן שבו תופסים אותם ביפאן, לעומת המערב:
https://youtu.be/sXz0boNmwak?long=yes
החשש או הפחד מרובוטים הוא אחד הגורמים הקבועים בתולדות הטכנולוגיה. למעשה שורשיו מצויים כבר הרבה קודם בתרבות האנושית, בסיפורים כמו "הגולם" על יצור מעשה אדם היוצא משליטה וב"פרנקנשטיין" שעלילתו דומה גם היא.
החשש כיום הוא פחות מצבאות רובוטים שישתלטו על העולם, במרד רובוטים עוינים בנוסח הסרטים של ארנולד שוורצנגר, או מרובוט כמו "האל", מהסרט האמריקאי משנת 1968 "2001: אודיסיאה בחלל", שמסרב לציית, לאחר שנעשה מודע והפך פסיכוטי ובהדרגה משתלט על ספינת חלל ומתחיל להרוג את אנשי הצוות.
המדענים והמומחים חרדים יותר מיצירת רובוטים שיהיו מאד אינטליגנטיים ובעלי יכולות השפעה עצומות על חיינו, אך במקביל חסרי רגשות וערכים, שיהיו אדישים למה שנחשב ראוי וקדוש בחברה האנושית, לחיי אדם, תפיסות מוסריות וכדומה.
נקצין רגע ונניח שרובוטים עתידיים ימונו לנהל מערכת פיננסית או כלכלית בעתיד. מה למשל יקרה אם הרובוטים שאמונים על הכלכלה בעולם שכזה יגיעו למסקנה שיעיל יותר לא להאכיל חצי עולם ופשוט לתת לו למות, כדי שלחצי השני יהיו חיים טובים? - זו החלטה יעילה וקרה שלא פעם התקבלה על ידי ניצולים, שהעדיפו לאפשר לחלקם לחיות, גם אם מחיר ההישרדות הוא חיי אדם של האחרים. מי ערב לנו ש"שואה יעילה" כזו לא תוכל להתקיים בעתיד בחסות הבינה הרובוטית?
הבעיה הגדולה כרגע היא שלמומחי הרובוטיקה הטובים ביותר אין שמץ של מושג איך מייצרים רובוט שמרגיש, מתלבט, מטיל ספק ובוחר באופציה הלאו דווקא יותר יעילה, אבל יותר מוסרית, רגישה או מתחשבת יותר.
בלשון פשוטה ניתן לומר שהבינה המלאכותית הגיעה לשלב שבו היא יודעת לתכנת יעילות, למזער נזקים ולשפר ביצועים, אבל היא רחוקה מיצירת רובוטים שפשוט יבקשו סליחה... ניתן בקלות לתכנת בקשת סליחה של רובוט, אבל החוכמה היא שהיא תבוא לאחר שהרובוט הבין את הפגם המוסרי בהתנהגותו ולא מפני שהוא זיהה בראייה ממוחשבת דמעות בעיניים של בן שיחו, יכולות שסוגלו לרובוטים מתקדמים כמו הרובוטית סופיה, הידועה ב"רגשות" שהיא מפגינה.
אז אולי נוכל לנתק את הרובוט מהחשמל? - ודאי עלתה מחשבה כזו בראשכם. כן ולא. בהתחלה זה אכן יהיה אמצעי אבטחה יעיל, אבל בשלב מסוים יפתחו בני-אדם רובוט שבכוונה לא ניתן יהיה לכבותו, כדי שיבצע את תפקידו מבלי שבני-אדם יפריעו לו. ככל שהרובוטים יהיו טובים יותר ובעלי יכולות טובות משלנו במילוי התפקידים שלהם, הרגע הזה של רובוט שלא ניתן לנתקו יתקרב. היעילות האנושית מבטיחה שהוא יגיע.
אגב, לא בכל העולם החשש הזה קיים. בעוד שבמערב הרובוטים נתפסים כבעלי פוטנציאל להרס, משהו מפחיד שעלול להפוך הרסני בעתיד, ביפאן ממש אוהבים אותם. אצלם אין שום חשש מהרובוטים והתפיסה המקובלת היא שהם די חמודים. אולי זו הסיבה שבזמן שבאמריקה מפתחים רובוטים צבאיים, היפאנים חוגגים את החיים בפיתוח של רובוטים חמדמדים, כמו כלבי רובוט עם זנבות דיגיטליים ועד הומנואידים שמחקים בני אדם, רוקדים, שרים וחיים את החיים.
הנה החששות מהבינה המלאכותית של הרובוטים הללו (עברית):
https://youtu.be/7qUJRUA0wm0?t=17s
בסרט "אדוננו הרובוט" רואים את תסריט הקצה של שליטה רובוטית במין האנושי כולו (מתורגם):
https://youtu.be/Qbjz5wFBovs
אוסף שמדגים כיצד הקולנוע והספרות הציתו את הפחד הגדול מהרובוטים הנבונים (עברית):
https://youtu.be/bqVwLXo2_3I
הדגמה של מצב הבינה המלאכותית:
https://youtu.be/poLZqn2_dv4
מסתבר שגם גורילות לא מתמסרות בקלות לרובוט גורילה:
https://youtu.be/podn2Szo1ls
וסרט תיעודי על הרובוטים ועל האופן שבו תופסים אותם ביפאן, לעומת המערב:
https://youtu.be/sXz0boNmwak?long=yes
האם רובוטים יגזלו לנו את הפרנסה?
בקרוב, ממש בקרוב, יוזמן עובד למשרד המנהל, לשימוע לפני פיטוריו. הוא לא ישמע שהוא פוטר מפני שאת עבודתו יכול לעשות רובוט, כי זה כבר קורה כמה עשרות שנים. רבים בשוק העבודה חוששים שמה שיקרה במשרד המנהל הוא שהשימוע עצמו ייערך אל מול רובוט.
רובוט מנהל.
זה לא סוד שרובוטים מבצעים כיום יותר ויותר תפקידים שבעבר היו ממלאים עובדים חרוצים יותר או פחות. היתרון בהם ברור - הם לעולם לא מתעייפים, אף פעם לא חולים או שובתים, שכרם נמוך (אם להחשיב את עלות הקנייה המקורית שלהם ואת הוצאות התחזוקה הרגילות), הילד לא חולה אצלם אף פעם והם ניתנים לשליטה מירבית, בידי ההנהלה.
ביל גייטס, מייסד חברת מיקרוסופט וממובילי עולם ההייטק, כבר אמר ב-2015 ש-45% מהמשרות שבהן עובדים בני אדם ניתן להעביר לרובוטים. ברור שהנתון הזה כבר השתנה כלפי מעלה. הסכנה ברורה, אבל העתיד לא ממתין לאישור, למדו על הדרכים לרכב על חידושי ה-AI במקום להידרס - בתגית "אבטלת AI, מומחיות".
הנה הפחד מהחלפת האדם בידי הרובוטים (עברית):
https://youtu.be/PDpUVICjokM
החששות מהבינה המלאכותית של הרובוטים הללו (עברית):
https://youtu.be/7qUJRUA0wm0?t=17s
על המשרות שרובוטים יאחזו בהן:
https://youtu.be/skG3okhx2TU
החלפת עובדים ברובוטים:
https://youtu.be/7c_XO3Ouzts
סרט תיעודי על העולם של הרובוטים והעתיד איתם:
https://youtu.be/8VvYu1fWyxA?long=yes
על העתיד האוטומטי לחלוטין וההבטחה שלו לאיום על העבודה האנושית:
https://youtu.be/rnBAdnNIIXk?long=yes
בקרוב, ממש בקרוב, יוזמן עובד למשרד המנהל, לשימוע לפני פיטוריו. הוא לא ישמע שהוא פוטר מפני שאת עבודתו יכול לעשות רובוט, כי זה כבר קורה כמה עשרות שנים. רבים בשוק העבודה חוששים שמה שיקרה במשרד המנהל הוא שהשימוע עצמו ייערך אל מול רובוט.
רובוט מנהל.
זה לא סוד שרובוטים מבצעים כיום יותר ויותר תפקידים שבעבר היו ממלאים עובדים חרוצים יותר או פחות. היתרון בהם ברור - הם לעולם לא מתעייפים, אף פעם לא חולים או שובתים, שכרם נמוך (אם להחשיב את עלות הקנייה המקורית שלהם ואת הוצאות התחזוקה הרגילות), הילד לא חולה אצלם אף פעם והם ניתנים לשליטה מירבית, בידי ההנהלה.
ביל גייטס, מייסד חברת מיקרוסופט וממובילי עולם ההייטק, כבר אמר ב-2015 ש-45% מהמשרות שבהן עובדים בני אדם ניתן להעביר לרובוטים. ברור שהנתון הזה כבר השתנה כלפי מעלה. הסכנה ברורה, אבל העתיד לא ממתין לאישור, למדו על הדרכים לרכב על חידושי ה-AI במקום להידרס - בתגית "אבטלת AI, מומחיות".
הנה הפחד מהחלפת האדם בידי הרובוטים (עברית):
https://youtu.be/PDpUVICjokM
החששות מהבינה המלאכותית של הרובוטים הללו (עברית):
https://youtu.be/7qUJRUA0wm0?t=17s
על המשרות שרובוטים יאחזו בהן:
https://youtu.be/skG3okhx2TU
החלפת עובדים ברובוטים:
https://youtu.be/7c_XO3Ouzts
סרט תיעודי על העולם של הרובוטים והעתיד איתם:
https://youtu.be/8VvYu1fWyxA?long=yes
על העתיד האוטומטי לחלוטין וההבטחה שלו לאיום על העבודה האנושית:
https://youtu.be/rnBAdnNIIXk?long=yes
מהי שרשרת מחשבה בלמידת מכונה?
דמיינו מודל AI שלא רק עונה לכם על השאלה ששאלתם אלא משתף אתכם בהסבר מפורט על סדר הפעולות שעשה בדרך לתשובה ובמהלך המחשבה שלו. נכון שזה מעולה? - זה מצוין כדי להבין, ללמוד, להשתפר וכמובן לאמת שהתשובה היא לא עוד הזיית AI, כמו שאנו מקבלים לעתים מהמודלים שלנו.
שרשרת מחשבה (Chain of thought ובקיצור COT) היא בדיוק שיטה כזו. טכניקה חדישה יחסית, שפותחה בתחום הבינה המלאכותית, לפיה הבינה מתבקשת לא רק לענות על שאלה, אלא להסביר ולשתף בכל שלב, בצעדים או בשלבים לקראת ועד הפיתרון. מכאן בא גם תרגום נוסף ואולי אף מדויק יותר בעברית של התהליך: "חשיבה מדורגת".
אם נדמיין לרגע שאנחנו מלמדים ילד לפתור בעיה מורכבת, סביר שלא נגיד לו את התשובה הסופית מיד. במקום זאת, נעדיף להוביל אותו אל הפתרון, בצעדים קטנים, צעד אחרי צעד. וזה בדיוק מה שקורה כשמתקשרים עם מודלים של בינה מלאכותית בדרך של שרשרת החשיבה, או החשיבה המדורגת.
באופן דומה, אפשר להנחות את הצ'טבוט כבר בפרומפט, לתת הסבר בשלבים של דרך הפתרון או ההגעה לתשובה ולא רק את התשובה עצמה.
#איך זה עובד בפועל?
זה לא מסובך. במקום לשאול "מה התשובה?", אפשר לכתוב למודל "בוא נחשוב על זה צעד אחרי צעד" או "הסבר לי את תהליך החשיבה שלך". התוצאה די מפתיעה: המודל הממושמע מתחיל לפרק את הבעיה לחלקים קטנים יותר, מסביר כל שלב בדרך ומוביל בהדרגה אל הפתרון המלא.
לטכניקה הזו יש משמעות מיוחדת בעולם הפרומפטים. כשאנחנו כותבים פרומפט חכם, אנחנו למעשה מזמינים את המודל לשתף אותנו בתהליך החשיבה שלו, בדיוק כמו תלמיד שמראה את כל שלבי הפתרון במחברת המתמטיקה. במקום לקבל תשובה יבשה וסופית, אנחנו מקבלים הצצה מרתקת אל תוך "המוח" של הבינה המלאכותית.
ושוב - לא מדובר רק על חקירת מידע, אלא על חקר הבינה האנושית עצמה. בדרך הזו אנו יכולים לחייב את הבינה להיות מאורגנת יותר ואולי אף ליפול פחות לאותן הזיות (Hallucinations), פריטי מידע שקריים או מטעים שלרוב מוצגים כעובדה.
#מה היתרון בשיטה הזו?
היתרון הגדול של שיטת "שרשרת המחשבה" הוא כפול: לא זו בלבד שהיא משפרת משמעותית את הדיוק של התשובות, אלא שהיא גם הופכת את כל התהליך לשקוף יותר. כשאנו, בני האדם, שותפים לתהליך המחשבה המודרגת הזו, ההרגשה היא כמו להציץ מעבר לכתפו של מומחה בזמן שהוא עובד - אנו לא רק רואים את התוצאה הסופית, אלא יכולים להבין בדיוק איך הגיעו אליה.
ובעידן שבו בינה מלאכותית הופכת לחלק בלתי נפרד מחיינו, היכולת להבין את תהליך החשיבה של מודל שפה או כל מכונה בינתית שהיא, היא לא רק יתרון, כי אחרי שמתנסים בה, מבינים כמה היא לעתים הכרחית.
הנה שרשרת מחשבה:
https://youtu.be/Fp-ue4UCE3s
הסבר יפה של ה-Chain of Thought:
https://youtu.be/4Iwnx2cVqtE
כך תשלטו בהנחיות שרשרת, באנגלית Chain prompting:
https://youtu.be/B4MR8m7V17A?long=yes
פודקסט AI על הסבר מפורט יותר על החשיבה המדורגת:
https://youtu.be/uo6y8oDrW3U?long=yes
והסבר מפורט יותר על זה:
https://youtu.be/C_gf9KNScIo?long=yes
דמיינו מודל AI שלא רק עונה לכם על השאלה ששאלתם אלא משתף אתכם בהסבר מפורט על סדר הפעולות שעשה בדרך לתשובה ובמהלך המחשבה שלו. נכון שזה מעולה? - זה מצוין כדי להבין, ללמוד, להשתפר וכמובן לאמת שהתשובה היא לא עוד הזיית AI, כמו שאנו מקבלים לעתים מהמודלים שלנו.
שרשרת מחשבה (Chain of thought ובקיצור COT) היא בדיוק שיטה כזו. טכניקה חדישה יחסית, שפותחה בתחום הבינה המלאכותית, לפיה הבינה מתבקשת לא רק לענות על שאלה, אלא להסביר ולשתף בכל שלב, בצעדים או בשלבים לקראת ועד הפיתרון. מכאן בא גם תרגום נוסף ואולי אף מדויק יותר בעברית של התהליך: "חשיבה מדורגת".
אם נדמיין לרגע שאנחנו מלמדים ילד לפתור בעיה מורכבת, סביר שלא נגיד לו את התשובה הסופית מיד. במקום זאת, נעדיף להוביל אותו אל הפתרון, בצעדים קטנים, צעד אחרי צעד. וזה בדיוק מה שקורה כשמתקשרים עם מודלים של בינה מלאכותית בדרך של שרשרת החשיבה, או החשיבה המדורגת.
באופן דומה, אפשר להנחות את הצ'טבוט כבר בפרומפט, לתת הסבר בשלבים של דרך הפתרון או ההגעה לתשובה ולא רק את התשובה עצמה.
#איך זה עובד בפועל?
זה לא מסובך. במקום לשאול "מה התשובה?", אפשר לכתוב למודל "בוא נחשוב על זה צעד אחרי צעד" או "הסבר לי את תהליך החשיבה שלך". התוצאה די מפתיעה: המודל הממושמע מתחיל לפרק את הבעיה לחלקים קטנים יותר, מסביר כל שלב בדרך ומוביל בהדרגה אל הפתרון המלא.
לטכניקה הזו יש משמעות מיוחדת בעולם הפרומפטים. כשאנחנו כותבים פרומפט חכם, אנחנו למעשה מזמינים את המודל לשתף אותנו בתהליך החשיבה שלו, בדיוק כמו תלמיד שמראה את כל שלבי הפתרון במחברת המתמטיקה. במקום לקבל תשובה יבשה וסופית, אנחנו מקבלים הצצה מרתקת אל תוך "המוח" של הבינה המלאכותית.
ושוב - לא מדובר רק על חקירת מידע, אלא על חקר הבינה האנושית עצמה. בדרך הזו אנו יכולים לחייב את הבינה להיות מאורגנת יותר ואולי אף ליפול פחות לאותן הזיות (Hallucinations), פריטי מידע שקריים או מטעים שלרוב מוצגים כעובדה.
#מה היתרון בשיטה הזו?
היתרון הגדול של שיטת "שרשרת המחשבה" הוא כפול: לא זו בלבד שהיא משפרת משמעותית את הדיוק של התשובות, אלא שהיא גם הופכת את כל התהליך לשקוף יותר. כשאנו, בני האדם, שותפים לתהליך המחשבה המודרגת הזו, ההרגשה היא כמו להציץ מעבר לכתפו של מומחה בזמן שהוא עובד - אנו לא רק רואים את התוצאה הסופית, אלא יכולים להבין בדיוק איך הגיעו אליה.
ובעידן שבו בינה מלאכותית הופכת לחלק בלתי נפרד מחיינו, היכולת להבין את תהליך החשיבה של מודל שפה או כל מכונה בינתית שהיא, היא לא רק יתרון, כי אחרי שמתנסים בה, מבינים כמה היא לעתים הכרחית.
הנה שרשרת מחשבה:
https://youtu.be/Fp-ue4UCE3s
הסבר יפה של ה-Chain of Thought:
https://youtu.be/4Iwnx2cVqtE
כך תשלטו בהנחיות שרשרת, באנגלית Chain prompting:
https://youtu.be/B4MR8m7V17A?long=yes
פודקסט AI על הסבר מפורט יותר על החשיבה המדורגת:
https://youtu.be/uo6y8oDrW3U?long=yes
והסבר מפורט יותר על זה:
https://youtu.be/C_gf9KNScIo?long=yes
מהם סרטוני דיפ פייק ומה הבעיה בהם?
דיפ פייק (Deep fake או Deepfake) הוא שמה של טכנולוגיית וידאו, מבוססת בינה מלאכותית (AI), המאפשרת לייצר מציאות שנראית אמיתית ומבוססת על אנשים אמיתיים, אך לא התרחשה מעולם.
זה נעשה על ידי לקיחת תמונות, סרטונים וקולות ושינוי שלהם באמצעות AI, באופן שמאפשר לייצר תכנים דומים, הנראים אמיתיים, אך מעולם לא קרו, התרחשו או נאמרו באמת.
טכנולוגיה זו הולכת ותופסת בשנים האחרונות את מקומה ברשתות החברתיות שבאינטרנט.
העיקרון המוביל בסרטוני ה-Deepfakes הוא שחזורי פנים מדויקים, המולבשים על סרטוני וידאו, תמונות או אנימציה ומייצרים מראות הנראים אמיתיים לגמרי.
בסרטונים, למשל, מדובר על החלפת פניו של מי שצולם בווידאו, באמצעות למידת מכונה. התוצאה של זה היא יצירה בקלות של סרטוני וידאו המציגים אנשים העושים מעשים שמעולם לא עשו באמת או אומרים דברים שלא נאמרו.
#תולדות ה"דיפ פייק"
את לידת הטכנולוגיה הזו סימנה אפליקציה בשם FakeApp, שפותחה בסין על ידי מיזם בשם MoMo. המיזם היה ככל הנראה החלוץ בכך שאפשר להמונים להדביק את פניהם לזמרים, שחקנים ודמויות ממשחקי וידאו. לראשונה ראו המשתמשים שמספיקה תמונה אחת של פניהם, כדי שהאפליקציה תדביק ותמפה אותה באופן אוטומטי על גבי הקליפים שהיא מציעה.
בשנת 2016 כבר פותחו מערכות למידת מכונה אוטומטיות וחזקות יחסית, כאלה שלומדות ומשתפרות בעצמן, ככל שהן מופעלות. המערכות הללו חזרו שוב ושוב על תהליכי יצירת Deepfake וככל שהתהליך נמשך, לאחר מיליוני פעמים, הן שיפרו את התוצר. בשנה זו יצאו כבר תוכנות שאפשרו זאת גם על מחשבי PC ביתיים וחלשים יחסית.
את שמה קיבלה הטכנולוגיה הזו בשנת 2017, ממשתמש באתר Reddit שכינויו "זיופים עמוקים". הוא טבע את המונח לאחר שערך כמה סרטונים פורנוגרפיים ובהם הוא הטמיע, באמצעות טכנולוגיית "למידה עמוקה" (Deep learning), את פניהם של ידוענים ומפורסמים שונים.
את פרסומה העיקרי חייבת הטכנולוגיה הזו לסרטוני "פייק ניוז", חדשות כזב, שיצרו תומכי פוליטיקאים בארצות הברית, במהלך קמפיין הבחירות לנשיאות 2020. לפתע החלו להופיע סרטונים בהם ממליצים ומסבירים נשיאי עבר ומשפיענים פוליטיים שונים על דברים בדויים ומנוגדים לאמת. על התחום הזה שווה לקרוא בתגית "פייק ניוז".
#למה משמשים סרטונים אלו?
טכנולוגיית ה-Deepfake משמשת ליצירת תוכן וידאו המציג מציאות בדויה לחלוטין, דברים שנראים ונשמעים אמיתיים ומצולמים, אך למעשה לא התרחשו מעולם.
ביטויי הסרטונים הללו, שזכו לכינוי Deepfakes, הם רבים. הם מתחילים מפוליטיקה בה מיוצרים כך נאומים שלא ננאמו ומעבירים מסרים בדויים מפיהם של ידוענים, מנהיגים ומפורסמים ומסתיימים כיום בסרטונים "פסאודו-תיעודיים", המציגים מעשים, מראות וטקסטים מדוברים, הנראים אמיתיים לחלוטין אך מעולם לא צולמו והוקלטו.
מדובר בעניין מהפכני. מעולם לא עמדה טכנולוגיה כה חזקה וריאליסטית לטובת תעשיית השקר, או בשמה המכובס, תעשיית ה"פוסט אמת".
בעולם של ה-Deepfakes השתפרו האפשרויות ליצירה והפצה של שקרים פראיים. הן כה מרשימות, עד כדי כך שמיליונים "נופלים בפח", מאמינים לסרטוני הדיפ פייק הללו ומשנים בגללם את דעותיהם ואף את התנהגותם והעדפותיהם הפוליטיות. ראו את סרטון הטבע שאנו מציגים למטה ובו בעלי חיים בדויים וכמה שהוא נראה אמיתי.
#סיכום
הכלים ליצירת סרטוני ה"דיפ פייקס" הם כלים טכנולוגיים, מתוחכמים מכל טכנולוגיה שעמדה בעבר לטובת השקרנים ומקדמי מה שזכה לכינויים כמו "אמת אלטרנטיבית", תיאוריות קונספירציה וכדומה.
מעולם לא עמדו טכנולוגיות כה חזקות לרשות השקרים הקטנים, להם מתאפשר עתה להמציא ולהפיק את הבדיות שלהם באופן מוחשי וריאליסטי מאי-פעם.
מצד שני, מעולם הדיפ פייק נולד עם הזמן גם יישום ה"דיפ נוסטלגיה". עד שימצאו גם לו שימושים מזיקים ואף מחרידים, זהו עולם חיובי, סנטימנטלי ומעורר התרגשות אמיתי, בהנחה שנוסטלגיה אינה מזיקה לאיש. ניתן לקרוא עליו בתגית "דיפ נוסטלגיה".
הסבר לטכנולוגיה (עברית):
https://youtu.be/lk-1hBpAyiU
אובמה מדבר פייק:
https://youtu.be/gLoI9hAX9dw
סרט טבע פיקטיבי שיצרו בעזרת Sora ומציג פייק חיות:
https://youtu.be/ObUBUKOn-bo
ההשלכות של זה מטורפות (עברית):
https://youtu.be/4BsiYnt51ok
כך יוצרים פנים ממאפיינים או שילובי פנים אמיתיים:
https://youtu.be/kSLJriaOumA
ושעשוע עם טראמפ ומיסטר בין:
https://youtu.be/HN-qlGf2mZw
דיפ פייק (Deep fake או Deepfake) הוא שמה של טכנולוגיית וידאו, מבוססת בינה מלאכותית (AI), המאפשרת לייצר מציאות שנראית אמיתית ומבוססת על אנשים אמיתיים, אך לא התרחשה מעולם.
זה נעשה על ידי לקיחת תמונות, סרטונים וקולות ושינוי שלהם באמצעות AI, באופן שמאפשר לייצר תכנים דומים, הנראים אמיתיים, אך מעולם לא קרו, התרחשו או נאמרו באמת.
טכנולוגיה זו הולכת ותופסת בשנים האחרונות את מקומה ברשתות החברתיות שבאינטרנט.
העיקרון המוביל בסרטוני ה-Deepfakes הוא שחזורי פנים מדויקים, המולבשים על סרטוני וידאו, תמונות או אנימציה ומייצרים מראות הנראים אמיתיים לגמרי.
בסרטונים, למשל, מדובר על החלפת פניו של מי שצולם בווידאו, באמצעות למידת מכונה. התוצאה של זה היא יצירה בקלות של סרטוני וידאו המציגים אנשים העושים מעשים שמעולם לא עשו באמת או אומרים דברים שלא נאמרו.
#תולדות ה"דיפ פייק"
את לידת הטכנולוגיה הזו סימנה אפליקציה בשם FakeApp, שפותחה בסין על ידי מיזם בשם MoMo. המיזם היה ככל הנראה החלוץ בכך שאפשר להמונים להדביק את פניהם לזמרים, שחקנים ודמויות ממשחקי וידאו. לראשונה ראו המשתמשים שמספיקה תמונה אחת של פניהם, כדי שהאפליקציה תדביק ותמפה אותה באופן אוטומטי על גבי הקליפים שהיא מציעה.
בשנת 2016 כבר פותחו מערכות למידת מכונה אוטומטיות וחזקות יחסית, כאלה שלומדות ומשתפרות בעצמן, ככל שהן מופעלות. המערכות הללו חזרו שוב ושוב על תהליכי יצירת Deepfake וככל שהתהליך נמשך, לאחר מיליוני פעמים, הן שיפרו את התוצר. בשנה זו יצאו כבר תוכנות שאפשרו זאת גם על מחשבי PC ביתיים וחלשים יחסית.
את שמה קיבלה הטכנולוגיה הזו בשנת 2017, ממשתמש באתר Reddit שכינויו "זיופים עמוקים". הוא טבע את המונח לאחר שערך כמה סרטונים פורנוגרפיים ובהם הוא הטמיע, באמצעות טכנולוגיית "למידה עמוקה" (Deep learning), את פניהם של ידוענים ומפורסמים שונים.
את פרסומה העיקרי חייבת הטכנולוגיה הזו לסרטוני "פייק ניוז", חדשות כזב, שיצרו תומכי פוליטיקאים בארצות הברית, במהלך קמפיין הבחירות לנשיאות 2020. לפתע החלו להופיע סרטונים בהם ממליצים ומסבירים נשיאי עבר ומשפיענים פוליטיים שונים על דברים בדויים ומנוגדים לאמת. על התחום הזה שווה לקרוא בתגית "פייק ניוז".
#למה משמשים סרטונים אלו?
טכנולוגיית ה-Deepfake משמשת ליצירת תוכן וידאו המציג מציאות בדויה לחלוטין, דברים שנראים ונשמעים אמיתיים ומצולמים, אך למעשה לא התרחשו מעולם.
ביטויי הסרטונים הללו, שזכו לכינוי Deepfakes, הם רבים. הם מתחילים מפוליטיקה בה מיוצרים כך נאומים שלא ננאמו ומעבירים מסרים בדויים מפיהם של ידוענים, מנהיגים ומפורסמים ומסתיימים כיום בסרטונים "פסאודו-תיעודיים", המציגים מעשים, מראות וטקסטים מדוברים, הנראים אמיתיים לחלוטין אך מעולם לא צולמו והוקלטו.
מדובר בעניין מהפכני. מעולם לא עמדה טכנולוגיה כה חזקה וריאליסטית לטובת תעשיית השקר, או בשמה המכובס, תעשיית ה"פוסט אמת".
בעולם של ה-Deepfakes השתפרו האפשרויות ליצירה והפצה של שקרים פראיים. הן כה מרשימות, עד כדי כך שמיליונים "נופלים בפח", מאמינים לסרטוני הדיפ פייק הללו ומשנים בגללם את דעותיהם ואף את התנהגותם והעדפותיהם הפוליטיות. ראו את סרטון הטבע שאנו מציגים למטה ובו בעלי חיים בדויים וכמה שהוא נראה אמיתי.
#סיכום
הכלים ליצירת סרטוני ה"דיפ פייקס" הם כלים טכנולוגיים, מתוחכמים מכל טכנולוגיה שעמדה בעבר לטובת השקרנים ומקדמי מה שזכה לכינויים כמו "אמת אלטרנטיבית", תיאוריות קונספירציה וכדומה.
מעולם לא עמדו טכנולוגיות כה חזקות לרשות השקרים הקטנים, להם מתאפשר עתה להמציא ולהפיק את הבדיות שלהם באופן מוחשי וריאליסטי מאי-פעם.
מצד שני, מעולם הדיפ פייק נולד עם הזמן גם יישום ה"דיפ נוסטלגיה". עד שימצאו גם לו שימושים מזיקים ואף מחרידים, זהו עולם חיובי, סנטימנטלי ומעורר התרגשות אמיתי, בהנחה שנוסטלגיה אינה מזיקה לאיש. ניתן לקרוא עליו בתגית "דיפ נוסטלגיה".
הסבר לטכנולוגיה (עברית):
https://youtu.be/lk-1hBpAyiU
אובמה מדבר פייק:
https://youtu.be/gLoI9hAX9dw
סרט טבע פיקטיבי שיצרו בעזרת Sora ומציג פייק חיות:
https://youtu.be/ObUBUKOn-bo
ההשלכות של זה מטורפות (עברית):
https://youtu.be/4BsiYnt51ok
כך יוצרים פנים ממאפיינים או שילובי פנים אמיתיים:
https://youtu.be/kSLJriaOumA
ושעשוע עם טראמפ ומיסטר בין:
https://youtu.be/HN-qlGf2mZw
מהם בוטי הכתיבה שכותבים חדשות ומייצרים אותן?
האם אנו בדרך לעולם שבו כל החדשות ייכתבו בידי תוכנות מחשב חכמות? - רבים סבורים שכן. מסתבר שכבר היום יש תוכנות מחשב שכותבות חדשות בעצמן. התוכנות הללו נקראות "בוט כתיבה" (Writing bot) והן ככל הנראה יהיו הכותבים של הרבה מהחומר החדשותי שנקרא בעתיד. כיום כותבים בוטי הכתיבה בקושי דיווחים בסיסיים, והם רחוקים מלהחליף את הכותבים האנושיים והמיומנים. נראה, עם זאת, שזה רק עניין של זמן, עד שיופיעו בוטים שיוכלו להפיק ראיונות ואפילו פרשנויות המבוססים על ביג דאטה וכרייה מבוססת אלגוריתמים של מידע סטטיסטי. כתבות עומק? - אפילו אלה אינן מחוץ לתחום מתישהו בעתיד...
בוטי הכתיבה של ימינו מבוססים על אלגוריתמי "דווחנות" עיתונאיים, שכבר כיום מפעילים העיתונים ואתרי החדשות המובילים בעולם. היכולת לדווח במהירות עצומה, ששום עיתונאי אנושי לא יוכל לה, היא אחד ממוקדי התחרות החשובים בעיתונות האונליין המודרנית. יש כאלה שמוסיפים לכתבה הבהרה ברורה, על כך שהכתב הוא בוט. כך נוהג למשל העיתון הכלכלי פורבס. עיתונים ואתרי חדשות אחרים, מעדיפים כרגע להימנע מכך, מחשש שקוראים לא יסמכו על כתבות שהפיקה תוכנה.
בעיתונות הספורט מייצרים כיום אלגוריתמי כתיבה משוכללים כתבות מקיפות ומנומקות היטב על משחקי ספורט. אלו עולים לרשת בתוך דקה משריקת הסיום של המשחק. כתבות כאלה כוללות סטטיסטיקות ממשחקים קודמים, מעונות קודמות, היסטוריה של המתחרים ועוד. לכתב אנושי היה לוקח שעות כדי לייצר דיווח כל כך מפורט ומנומק של המשחק. הבוט עושה את זה בדקות, אם לא בשניות. כמובן שאת רוב עבודת האיסוף והניתוח הוא מבצע במהלך המשחק.
גם בתחום הכלכלה, שבו זמן פרסום המידע שווה לעיתים כסף רב, משתמשים היום באלגוריתמים כאלה. כך משמשים אלגוריתמים אוטומטיים של כתיבה עיתונאית להנפקת כתבות, שמפורסמות שניות לאחר אירועים בבורסה או בשוק ההון.
בתחומים של משברים ואסונות יש להם יתרון. באתרים מסוימים התפרסמה כתבה על רעידת אדמה כ-3 דקות לאחר שהתרחשה. אגב, הבוט שכתב אותה עשה זאת בתוך שניות. שאר הזמן בדקות הללו, עד שפורסמה הידיעה, נדרש כדי שהעורך או העיתונאי האנושי יאשר לפרסם את הכתבה.
פיתוח הבוטים העיתונאיים הללו ממשיך ליעדים שאפתניים מאד. מחשוב תהליכים מקביליים, של איסוף מידע וניתוחו, תוך התמודדות עם כמויות הולכות וגדלות של נתונים מתחומים שונים, איתור ותיקון מהיר של טעויות בנתונים או חיפוש ואיתור אוטומטי של אותם "סקופים" אפשריים, שיעוררו עניין בציבור.
אגב, חלק מהבוטים הללו כבר הוסבו לשימושים פוליטיים. הם "מאיישים" פרופילי פייסבוק מזויפים, מגיבים לציוצי טוויטר או מצייצים בעצמם, מפיצים פייק ניוז או ריל ניוז ביעילות מפחידה ובקיצור - ממלאים את תפקידם של הפוליטיקאים ודובריהם, במכפלות כוח מטורפות שמאפשרות שינויים ממשיים בדעת הקהל.
היתרונות של העיתונאי הרובוטי ברורים - מרגע שהוא פותח, השימוש בו זול מאוד. הוא לא זקוק לחופשות או לתנאים סוציאליים, אין לו ילד חולה והוא אף פעם לא שובת בשל תנאי העבודה הלוחצים או השכר הנמוך..
עוד על כך קראו באאוריקה בתגית: "עיתונאי רובוט". שם תכירו בוטי כתיבה חכמים שמייצרים מאמרים מנתונים גולמיים, מה'ביג דאטה' של תחומים כמו ספורט ועיתונות.
מוצר של חברת "Automated Insights" שמנתח נתונים רבים ומספק מאמרים בלשון אנושית, שקל לקרוא ולהבין:
http://youtu.be/hx1SMxgxKnc
על פרק נוסף ומדהים של הארי פוטר שנכתב על ידי בוט כתיבה:
https://youtu.be/XFYckCslt74
בוט כתיבה שלומד את כתב היד שלך וכותב בשמך:
https://youtu.be/LsZH7SS_lfQ
ועוד רובוט כתב יד:
https://youtu.be/BqgT_Nu0QnY
האם אנו בדרך לעולם שבו כל החדשות ייכתבו בידי תוכנות מחשב חכמות? - רבים סבורים שכן. מסתבר שכבר היום יש תוכנות מחשב שכותבות חדשות בעצמן. התוכנות הללו נקראות "בוט כתיבה" (Writing bot) והן ככל הנראה יהיו הכותבים של הרבה מהחומר החדשותי שנקרא בעתיד. כיום כותבים בוטי הכתיבה בקושי דיווחים בסיסיים, והם רחוקים מלהחליף את הכותבים האנושיים והמיומנים. נראה, עם זאת, שזה רק עניין של זמן, עד שיופיעו בוטים שיוכלו להפיק ראיונות ואפילו פרשנויות המבוססים על ביג דאטה וכרייה מבוססת אלגוריתמים של מידע סטטיסטי. כתבות עומק? - אפילו אלה אינן מחוץ לתחום מתישהו בעתיד...
בוטי הכתיבה של ימינו מבוססים על אלגוריתמי "דווחנות" עיתונאיים, שכבר כיום מפעילים העיתונים ואתרי החדשות המובילים בעולם. היכולת לדווח במהירות עצומה, ששום עיתונאי אנושי לא יוכל לה, היא אחד ממוקדי התחרות החשובים בעיתונות האונליין המודרנית. יש כאלה שמוסיפים לכתבה הבהרה ברורה, על כך שהכתב הוא בוט. כך נוהג למשל העיתון הכלכלי פורבס. עיתונים ואתרי חדשות אחרים, מעדיפים כרגע להימנע מכך, מחשש שקוראים לא יסמכו על כתבות שהפיקה תוכנה.
בעיתונות הספורט מייצרים כיום אלגוריתמי כתיבה משוכללים כתבות מקיפות ומנומקות היטב על משחקי ספורט. אלו עולים לרשת בתוך דקה משריקת הסיום של המשחק. כתבות כאלה כוללות סטטיסטיקות ממשחקים קודמים, מעונות קודמות, היסטוריה של המתחרים ועוד. לכתב אנושי היה לוקח שעות כדי לייצר דיווח כל כך מפורט ומנומק של המשחק. הבוט עושה את זה בדקות, אם לא בשניות. כמובן שאת רוב עבודת האיסוף והניתוח הוא מבצע במהלך המשחק.
גם בתחום הכלכלה, שבו זמן פרסום המידע שווה לעיתים כסף רב, משתמשים היום באלגוריתמים כאלה. כך משמשים אלגוריתמים אוטומטיים של כתיבה עיתונאית להנפקת כתבות, שמפורסמות שניות לאחר אירועים בבורסה או בשוק ההון.
בתחומים של משברים ואסונות יש להם יתרון. באתרים מסוימים התפרסמה כתבה על רעידת אדמה כ-3 דקות לאחר שהתרחשה. אגב, הבוט שכתב אותה עשה זאת בתוך שניות. שאר הזמן בדקות הללו, עד שפורסמה הידיעה, נדרש כדי שהעורך או העיתונאי האנושי יאשר לפרסם את הכתבה.
פיתוח הבוטים העיתונאיים הללו ממשיך ליעדים שאפתניים מאד. מחשוב תהליכים מקביליים, של איסוף מידע וניתוחו, תוך התמודדות עם כמויות הולכות וגדלות של נתונים מתחומים שונים, איתור ותיקון מהיר של טעויות בנתונים או חיפוש ואיתור אוטומטי של אותם "סקופים" אפשריים, שיעוררו עניין בציבור.
אגב, חלק מהבוטים הללו כבר הוסבו לשימושים פוליטיים. הם "מאיישים" פרופילי פייסבוק מזויפים, מגיבים לציוצי טוויטר או מצייצים בעצמם, מפיצים פייק ניוז או ריל ניוז ביעילות מפחידה ובקיצור - ממלאים את תפקידם של הפוליטיקאים ודובריהם, במכפלות כוח מטורפות שמאפשרות שינויים ממשיים בדעת הקהל.
היתרונות של העיתונאי הרובוטי ברורים - מרגע שהוא פותח, השימוש בו זול מאוד. הוא לא זקוק לחופשות או לתנאים סוציאליים, אין לו ילד חולה והוא אף פעם לא שובת בשל תנאי העבודה הלוחצים או השכר הנמוך..
עוד על כך קראו באאוריקה בתגית: "עיתונאי רובוט". שם תכירו בוטי כתיבה חכמים שמייצרים מאמרים מנתונים גולמיים, מה'ביג דאטה' של תחומים כמו ספורט ועיתונות.
מוצר של חברת "Automated Insights" שמנתח נתונים רבים ומספק מאמרים בלשון אנושית, שקל לקרוא ולהבין:
http://youtu.be/hx1SMxgxKnc
על פרק נוסף ומדהים של הארי פוטר שנכתב על ידי בוט כתיבה:
https://youtu.be/XFYckCslt74
בוט כתיבה שלומד את כתב היד שלך וכותב בשמך:
https://youtu.be/LsZH7SS_lfQ
ועוד רובוט כתב יד:
https://youtu.be/BqgT_Nu0QnY
