GenAI

» «

מהי הבינה המלאכותית גנרטיבית שיודעת לייצר תוכן?

בינה מלאכותית גנרטיבית (Generative AI), בעברית "בינה מלאכותית יוצרת", היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.

התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד. על מגוון התחומים וההיבטים שלה תוכלו ללמטד בתגית "GenAI".

#הבינה היוצרת יודעת לעשות 3 דברים עיקריים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.

התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה (ראו בתגית "פרומפטים").

לפרומפטים הללו מתווספים לעתים ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר למתחילים. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח עם מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI ומבוצעות מיד.

ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.

בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה (בצירוף עובדים שלא יתעדכנו לחידושי ה-AI). לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.

אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".

הנה הסבר על הבינה הגנרטיבית:

https://youtu.be/rwF-X5STYks

הבינה היצירתית והתחומים שהיא עתידה לשבש:

https://youtu.be/vneJieU5qlg

היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):

https://youtu.be/05oOucZmO8Y

התפתחות התחום הגנרטיבי כפי שהוא מוצג באחת מאלפי חברות Generative AI (עברית):

https://youtu.be/joJVqKTPVsY

מהי בינה גנרטיבית?

https://youtu.be/pWNAtUwnBS8

משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:

https://youtu.be/3Jopz-V-IRQ

הנה הסבר מעמיק על הבינה המלאכותית היוצרת:

https://youtu.be/2IK3DFHRFfw?long=yes

אוסף חידושי וחדשות AI וידאו מדצמבר 2024:

https://youtu.be/30ZoRlr-TrY?long=yes

וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:

https://youtu.be/2IK3DFHRFfw?long=yes

מהם מנועי תמונות ובינה ויזואלית ב-AI?

הבינה המלאכותית היצירתית (GenAI) כמו DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.

הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצרת AI, לציירת, צלמת ועוד כל מיני סוגי אמנים - אבל במקרה שלה - תמיד באינטליגנציה מלאכותית.

באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימי-בייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ואפילו מדהימים.

ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.

להישג המקורי של DALL-E קמו די מהר מתחרים איכותיים לא פחות ואף יותר. הם מציעים עולם חדש וחסר תקדים של ציירים בינתיים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.

איש לא יודע בדיוק כיצד המנועים השונים פועלים, אבל זו עבודה מדהימה של למידה עמוקה שמעבדת בעצמה את הדאטה ממיליוני תמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.

התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית ותחרות של חברות ומפתחי קוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין. השטח מלא במודלים שבראשם מידג'רני, אידיאוגרם ו-Flux, המודל בקוד פותח שמייצר תוצרים שומטי לסתות.

מחפשים ליצור סגנונות של ציורים? - ראו בתגית "כלי איי, תמונות, סגנונות".

הנה כלי Gen AI מצטיין בשם ideogram ליצירה ויזואלית:

https://youtu.be/XZjaHJP0PQE

באיזה כלי לבחור לכל צורך? (עברית)

https://youtu.be/a5wUS6SQ0us?t=1m47s

"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:

https://youtu.be/qTgPSKKjfVg

על היכולת המופלאה של דאלי ליצור אמנות:

https://youtu.be/hiSgpZUAy2c

הסבר אמנות ה-AI:

https://youtu.be/alJdw4JDJ4o

מנועי יצירת תמונות מתחרים:

https://youtu.be/rGbNJrywLhk

גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):

https://youtu.be/KR29znIp2LU

ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:

https://youtu.be/G-Wsh1vUeVQ

קבלו משפר פרומפטים ליצירת תמונות (עברית):

https://youtu.be/HLhRFaXQ0vQ

מדריך להרחבת תמונות:

https://youtu.be/V1KLG159A2s

קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:

https://youtu.be/VR3AWdyVVdU

למה יש לבינה כל הזמן בעיה עם אצבעות?

https://youtu.be/24yjRbBah3w

גם למחוללי תמונות מעולים כמו מידג'רני יש בעיות (עברית):

https://youtu.be/xUpUhHsAWlg?long=yes

הסבר מעמיק וארוך על יצירת תמונות גנרטיבית (עברית):

https://youtu.be/aHPFq-Q6JQ0?long=yes

ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:

https://youtu.be/FRClNMC_z-s?long=yes

מהו מרחץ הדמים של ה-AI?

מרחץ הדמים של ה-AI, או אמבטיית הדמים של הבינה המלאכותית (AI bloodbath) הוא כינוי שניתן לתופעה חדשה, בה מאיימת הקידמה האדירה של הבינה המלאכותית כיום על מקצועות ומשרות רבות במשק, בעוד האנושות לא עושה דבר.

הדימוי התעסוקתי המרוכך שכנראה ידבר אליכם הוא פחות או יותר של סרט אימה בו נכנס ומתפרץ למקום העבודה שלך מחסל-על, טרמינטור אכזרי שעובר שולחן שולחן, משרד משרד, ומחסל בירי מקרוב ובלי להשאיר פצועים את כל בעלי התפקידים ונושאי המשרות. רק בחדר הישיבות של ההנהלה יושבים המנהלים, כשהם מוגנים מההרג וממתינים שיסתיים.

האם זה גורלנו?

כנראה שכן. כי האזהרה שזעזעה את עולם הטכנולוגיה הגיעה ממקום בלתי צפוי ובכנות מפתיעה. היה זה דריו אמודיי (Dario Amodei), מנכ"ל חברת אנתרופיק (Anthropic), שמפתחת את הצ'טבוט המעולה קלוד (Claude) ולידו מערכות בינה מלאכותית מתקדמות. אמודיי הזהיר בראיון לאקסיוס (Axios) בסוף מאי 2025 שהבינה המלאכותית עלולה לחסל מיליוני משרות במשק. הוא גם מנבא שיחוסלו עד מחצית מהמשרות הזוטרות בתחומים של הצווארון הלבן וששיעור האבטלה יעלה ל-10 עד 20 אחוזים במהלך השנים הקרובות.

שנבין, 10% אבטלה במשק כלכלי הוא דבר נורא ואם היא רק המינימום ורק בשנים הקרובות, כל אחד יכול להבין עד כמה האזהרה הזו משמעותית. המונח "מרחץ הדמים של הבינה המלאכותית" או בתרגום מילולי "אמבטיית הדמים של ה-AI" (רמז לזה שאנו מתאבדים תעסוקתית) נטבע בעקבותיה, כשאמודיי קרא לתעשייה להפסיק להמתיק את המציאות ולהתחיל להתמודד עם האיום האמיתי. הדבר המפתיע באזהרה הוא המקור שלה - מנכ"ל של אחת החברות המובילות בפיתוח הטכנולוגיה שמפניה הוא עצמו מזהיר.

התעשייה הגיבה בצורה מעורבת לאזהרה. חלק ממומחי הכלכלה והטכנולוגיה תמכו בחומרת הניבוי, בעוד אחרים הביעו ספקנות לגבי לוח הזמנים והיקף ההשפעה החזויה. איש מהם, אגב, לא הקל ראש במגמה ובכיוון, אם כי יש קולות שרואים בכל העניין חלק ממאמץ של תעשיית הבינה המלאכותית להגדיל את האימפקט שלה ולהציג עצמה כמשפיעה וחשובה יותר ממה שהיא באמת.

אבל עדיין - שימו לב שוב לפרדוקס שכאן - בדיוק החברות שמפתחות את הטכנולוגיה הן שמזהירות מפני השלכותיה החברתיות. הבה נשים לב לניגוד הזה סזמן שאנו עוסקים בשאלה אם מדובר באזהרה אמיתית ומבוססת נתונים או בטקטיקת יחסי ציבור מתוחכמת מצד אותן חברות, זהן לפני הכל חברות עסקיות, עם משקיעים, מניות ושווי שוק שמרוויח מהבהלה.

הנה מרחץ הדמים של ה-AI:

https://youtu.be/nVT9V9FgFnk

מרחץ הדמים של AI מעולם לא פגש כל כך הרבה מקצועות ומקצועות של צווארון לבן:

https://youtu.be/70uNJpSHLBo

האיום על עורכי הדין:

https://youtu.be/WoqcSIcdx-Y

רגע, מה אמרת?

https://youtu.be/jDR0AwE7hAg

האם מרחץ הדמים הזה אכן מתרחש?

https://youtu.be/yWON02X8tB0?long=yes

כך ה-AI מאיים דווקא על מקצועות הצווארון הלבן:

https://youtu.be/lxvIuoD-nOs?long=yes

מהי המוסיקה שיוצר ה-AI?

המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.

בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.

הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:

1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.

2. ללמוד מהדאטה הזה איך הדברים נשמעים.

3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).

פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.

את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.

היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.

פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.

עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.

הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:

https://youtu.be/3_pxKK2wqvI

הבינה המוסיקלית המדהימה של Udio:

https://youtu.be/aQC0FI_asKY

המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:

https://youtu.be/dAq0YcOAB4k

ההבטחה של Fugatto של אנבידיה:

https://youtu.be/qj1Sp8He6e4

הדוגמאות של המודל הבא מ-Eleven labs:

https://youtu.be/WA4Aco4rnTA

ניסיתם כבר להלחין בהמהום?

https://youtu.be/vA63-nDMYGg

תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:

https://youtu.be/Xfhulh3iyWQ

מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:

https://youtu.be/iQ6ITnYAIok

Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:

https://youtu.be/FSbXnOKBK40

Riffusion - הכלי החדש ליצירת מוסיקת AI (עברית):

https://youtu.be/c5_agjg-_Q4?long=yes

ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:

https://youtu.be/cvRJ_izhs28?long=yes

ואיך עובדים עם סונו 4:

https://youtu.be/5zYHm35V998?long=yes

מה זה וייב קודינג שמאיים להחליף את התכנות המסורתי?

"וייב קודינג" (Vibe Coding), בעברית "קידוד אווירה", הוא גישה חדשנית לתכנות, המאפשרת לאנשים ליצור תוכנות באמצעות פרומפטים, פקודות פשוטות יחסית, בשפה רגילה וללא צורך בידע מעמיק בתכנות.

הרעיון המרכזי ב"קידוד האווירה" הוא שימוש בכלים מבוססי בינה מלאכותית שמפשטים את תהליך הפיתוח, כך שגם אנשים ללא רקע טכני יכולים להורות למכונה בשפתם, במקום באמצעות כתיבה של קוד, לפתח תוכנות, אפליקציות ויישומים קטנים. כך מאפשרים לדוגמה כלים כמו Cursor או Replit למשתמשים להקליד בקשות פשוטות, בשפה טבעית והכלי מייצר את הקוד, בהמרה אוטומטית לחלוטין.

בזכות היכולת של הווייב קודינג לייעל תהליכים ולהפחית עלויות, הגישה מעוררת עניין רב גם בקרב יזמים ומפתחים.

הגישה הזו זוכה להצלחה רבה בעמק הסיליקון ולהערכה והשקעות מהחברות המובילות בעולם הבינה היוצרת (Generative AI). מובילות תחום קידוד האווירה, כמו OpenAI ומיקרוסופט משקיעות בחברות מהפכניות, כמו Cursor, שמדגימות את הכיוון באופן מובהק.

קחו את Cursor, למשל. חברה שהוקמה בידי 4 מפתחים צעירים ומבריקים, תוך שהיא מגיעה במהירות אדירה להכנסות משמעותיות ולשווי של מיליארדי דולרים, עם כוח אדם מצומצם של פחות מ-25 עובדים.

נכון לתחילת 2025 וייב קודינג עדיין לא מחליף מתכנתים מקצועיים, לפחות באשר למוצרים מורכבים ואמינים. כדי ליצור כאלו עדיין נדרש ידע מעמיק בתכנות ובהבנה של מערכות, סביבות פיתוח, שפות תוכנה, ספריות קוד ועוד. יחד עם זאת, ההתפתחות המהירה של הכלים הללו סביר שתשנה את המצב בעתיד הקרוב.

הנה הסבר של וייב קודינג וכלים לקידוד ועיצוב UX ברוח זו:

https://youtu.be/9tw_HL5mnIg

תכנות וייב של סוכני AI באמצעות כלי קידוד אווירה:

https://youtu.be/Cf38Bi8U0Js

מהו וייב קודינג ומי זה אנדריי קרפטי? (עברית)

https://youtu.be/T9huPN10uSw

קורס וייב קודינג בעזרת Cursor:

https://youtu.be/dan3QfN3CDU

דוגמה לפיתוח וייב קודינג עם Base 44 (עברית):

https://youtu.be/luGJU_6jqR0?long=yes

כלי Vibe Code כתנועת המונים שמסביר שעדיף לתכנת בכלי VScode מאשר בכלי דפדפן (משוכנעים יכולים להתחיל ב-11:51):

https://youtu.be/V0TGQRAt4wg?long=yes

קורס קרסר של 2.5 שעות למעמיקים שרוצים לתכנת וייב קודינג ומוכנים להשקיע:

https://youtu.be/faezjTHA5SU?long=yes

ומגוון כלי וייב קודינג ששווה להכיר:

https://youtu.be/EVsJ-qlEQp8?long=yes

מה זה LoRA ב-AI ולמה היא משמשת?

LoRA, ובעברית לורה (Low-Rank Adaptation) היא טכניקה בעולם ה-GenAI, העולם של הבינה המלאכותית היוצרת. היא מאפשרת כוונון עדין (fine-tuning) של מודלי AI גדולים (LLMs) וכלליים מדי, להתאמה של מודלים קיימים לצרכים ספציפיים בצורה יעילה וחסכונית במשאבים.

מפני שההסבר הטכני הזה כנראה לא מובן מדי, נסביר את הלורה באמצעות דוגמה פשוטה:

נניח שיש לנו מודל AI שיודע לג'נרט (generate), כלומר לצייר בבינה מלאכותית. אנחנו רוצים שהוא ייצר דמויות בסגנון אנימה או דמות מסוימת, שמשום מה הוא אינו מכיר, כי היא לא הייתה בדאטה שהוא אומן עליו.

לכן, במקום לבקש שיאמנו את המנוע, או המודל הגדול, מחדש על המון ציורי אנימה, או להמתין בסבלנות מתסכלת עד שיום אחד הוא כן יכיר את הסגנון או הדמות הספציפית, נשתמש בטכניקה שונה. טכניקת הלורה.

ב-LoRA, כדי ללמד את המודל על הסגנון הזה או על הדמות המסוימת שאנחנו רוצים, מאפשרים לנו לאמן אותו בעצמנו, בעזרת דוגמאות בודדות ש"נראה לו", כלומר נטען אליו ב-Upload.

השיטה היעילה הזו לכוונון עדין של מערכות AI, מתאימה במיוחד ליצירת תמונות ריאליסטיות, למשל, להתאמה של סגנונות עיצוביים או ליצירת דמויות עקביות בפרויקטים גרפיים, תוך שימוש בכמות קטנה יחסית של נתוני אימון.

כך נוכל ליצור, למשל את אותה דמות מדויקת, בסצנות שונות של סרטון שמייצר ה-AI או בציורי קומיקס רציפים שנוצרים כך.

כלומר,ה-LoRA נועדה להוסיף שכבת משקולות חדשה למודל המקורי, מבלי לשנות אותו, תוך כדי קיצור של זמן האימון ושיפור של הגמישות שלו.

ואגב, השיטה עובדת עבור כל רשת עצבית ולא רק עבור מודלי שפה גדולים LLMs (קראו עליהם בתגית "LLM").

הנה הסבר של רעיון ה-LoRA:

https://youtu.be/lixMONUAjfs

כך יוצרים LoRA במערכת ספציפית:

https://youtu.be/HfwFgkFCtpM

ויצירת לורה של דמות מוכרת:

https://youtu.be/KEv-F5UkhxU?long=yes

מהו הפרומפט בעולם הבינה היוצרת הגנרטיבית?

מהו המקביל של מברשת הציור של ציירים, כלי הנגינה של המלחין או העט והמקלדת של הסופר או המשורר?

בעולם הבינה המלאכותית הגנרטיבית זהו הפרומפט (Prompt), ההוראה הכתובה, הנחייה טקסטואלית שאנחנו כותבים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו את התוצר שאנו רוצים.

בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצאה שנרצה לקבל מהבינה. עליו מתבסס כבר הגל החדש של פיתוח תוכנה, זה שזכה לכינוי "קידוד אווירה", בלועזית וייב קודינג (Vibe Coding), אבל ביצירת תמונות, שירים או סרטוני וידאו הוא כבר מזמן כלי עבודה לכל דבר.

הפרומפט של ימינו הוא כבר מזמן המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.

זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.

#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.

יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.

#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:

פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:

ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח.

אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, אם יש דברים שלא תרצו הרי שתוכלו להציב גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".

שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה.

זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.

בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה.

אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').

הסבר כמו למתחיל - בקשו בפרומפט כך:

"Explain [subject] in simple terms. Explain to me as if I'm a beginner."

כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):

https://youtu.be/joJVqKTPVsY

השיעור הראשון בניסוח הפרומפט:

https://youtu.be/Qos2rG3zVAM

איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):

https://youtu.be/zFS7WtovYmo

יש תוכנה לעזרה בניסוח פרומפטים (עברית):

https://youtu.be/HLhRFaXQ0vQ

על הפרומפט שמייצר חדשות קוליות לגיק (עברית):

https://youtu.be/5TlsXXTamBs

מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:

https://youtu.be/pZsJbYIFCCw

הנה מקצוע מהנדס הפרומפט:

https://youtu.be/Bq-ncjOGeVU

עצות וטיפים לפרומפטים ושיחות עם צ'טבוטים (עברית):

https://youtu.be/R4E_lc_2wtY?long=yes

והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:

https://youtu.be/hd7l9F3n4ZM?long=yes

מה זה אג'נטיק AI?

בינה מלאכותית אג'נטית (Agentic Al) היא סוג של בינה מלאכותית שמשלבת את מודלי השפה, כמו ה-GPT, עם כלי פיתוח, ידע ופעולות שנועדו לאפשר בנייה של "סוכנים בינתיים" (AI agent) שיסייעו לנו במשימות שונות.

המושג הזה והכלים המיועדים עבור Agentic Al מכוונים בדרך כלל למתכנתים. אך לעולם של בניית סוכני AI הולכים ונכנסים, ללא כתיבת קוד, גם מי שאינם מתכנתים.

נזכיר שאותם סוכני AI שהאג'נטיק AI מאפשר הם כבר לא לאו דווקא מודלי שפה כלליים שעושים או יודעים לעשות הכל, כמו ה-LLMים הגדולים, אלא מנועים מתמחים, מתוכנתים עם יעדים ברורים ומכוונים לביצוע של משימות ספציפיות, עבור אנשים פרטיים או לארגונים ועסקים.

כי בניגוד למנועי השפה הגדולים (LLM) שהתמחו בהמלצות, עזרה וחשיבה, אבל בעיקר בטקסט, הסוכנים החכמים יכולים לעשות וממש עושים פעולות בעולם האמיתי ומהחיים עצמם - הם מתכנתים, בונים אתרים, משווקים, יוצרים תוכן, משרתים לקוחות, נותנים תמיכה ושירות, מעדכנים גיליון אלקטרוני, נותנים תמיכה טכנית, עונים לאימיילים, קונים מוצרים ועוד המון.

#שלוש תכונות בסיס יש לסוכני AI:

אוטונומיה - שמשמעותה פעילות ללא צורך מתמיד בהנחיה אנושית.

סתגלנות - יכולתם ללמוד מהאינטראקציות שלהם ולהגדיר מחדש את האלגוריתמים שלהם על סמך הידע שרכשו.

מכוונות למטרה - הם מתוכנתים להשגת יעדים ברורים, כמו נהיגה ברכב אוטונומי, טיפול במיילים שלנו, או תזמון פגישות.

#אג'נטיק AI בתעשיה
בחברות ענק מפתחים כל הזמן סוכנים חכמים שיכולים לבצע משימות, בפיקוח של מנהלים וראשי צוותים כמובן. אלה מערכות אוטונומיות ואג'נטיות, מבוססות בינה מלאכותית, המסוגלות לבצע משימות מורכבות, ממש כמו "מערכות המומחה", שמדענים חלמו עליהן בשנות ה-80 המאוחרות ומתגשמות עכשיו כסוכני בינה מלאכותית (AI Agents) שעובדים על סטרואידים.

אותם סוכנים, מבוססי בינה מלאכותית, ממש עובדים בשביל החברה וכבר בהתחלה משתמשים בכלים יומיומיים כמו Gmail, Salesforce, Office365, Google Sheets ועוד. הם מקבלים משימות מורכבות, מסוגלים לפרקן לתתי-משימות ולחלק את העבודה על ידי שיוך כל תת-משימה כזו לסוכן ה-AI המתאים ביותר לבצעה. כך ניתן לקבל את הפתרונות המתאימים ביותר גם למשימות מורכבות ביותר.

#עתיד מרובה סוכנים
השלב הבא הוא כמובן שלב החיבור של מספר סוכנים ועובדים חכמים שכאלה, לעבודה משותפת ומילוי משימות משותף. כי אחת היכולות המשמעותיות ביותר של סוכן AI היא לתקשר ולשתף פעולה עם מערכות AI אחרות, לצד תשתיות דיגיטליות. זה מה שמאפשר גישה משולבת ויעילה יותר, למשל לפתרון בעיות וניהול משימות בבית. זה נקרא בתעשייה "מערכות מרובות סוכנים" (Multi-Agent Systems).

דמיינו שרשרת של מכונות חכמות הפועלות כמו משרד אנושי, בו לכל עובד יש התמחות ותפקיד תואם. השלם בה הוא גדול מסכום חלקיו, קצת כמו הקובוטים (Cobots), עדרי הרובוטים המסונכרנים להפליא, שעובדים במחסני ומרכזי השילוח של Amazon.

מהחזון האג'נטי הזה קל לדמיין כיצד קם ז'אנר חדש ואולטרה מודרני של עסקים. אלה מפעלים תעשייתיים, וירטואליים לחלוטין, כמעט ללא בני אדם, או עם בני האדם המפקחים ומנהלים את הבינות, כשהם מייצרים בקבוצות קטנות את מה שבעבר חייב מאות או אלפי עובדים ויותר.

זה העתיד והוא מתחיל עכשיו. אג'נטיק AI מבטיח בפשטות שאם פעם השמיים היו הגבול, היום האופק הוא השמיים ואת הגבול לא ניתן לראות.

הנה הסבר על Agentic AI:

https://youtu.be/-pqzyvRp3Tc

אלה הם סוכני AI:

https://youtu.be/Fyo6vnM8BBk

כך יוצרים סוכן AI ב-Claude בתחילת 2025:

https://youtu.be/amCjKc9O_Bo

Windsurf האג'נטי הוא סוכן AI שמייצר קוד לתוכנות ואתרים:

https://youtu.be/pOvI02of5oo

הבשלת היכולות של סוכנים חכמים מבוססי AI היא תוצאה של התפתחות אדירה. הנה "Do Browser" שיודע לתת לנו שירות מופלא אונליין:

https://youtu.be/vMFWeCMrFNU

וזה החזון המבהיל או מבטיח - תאגיד של אחד או אחת:

https://youtu.be/6EGqLE0Y6Z0?long=yes

איך מפתחים אפליקציות עם AI?

פיתוח כלים ואפליקציות בעזרת AI הפכה כבר מזמן לעובדה קיימת ומאיצה פיתוחים. יש כלים רבים המתחרים על משתמשים ומפתחים ברמות שונות, ממתחילים גמורים ועד מתכנתים מנוסים ומהנדסי תוכנה שהקידוד משתנה להם במהירות והם מתרגלים לכך שחלק גדול מהקוד שלהם יכול להכתב באמצעות סוכני AI מקודדים או הרחבות של VS-code כמו קופיילוט וקרסר.

Google Firebase Studio היא סביבת פיתוח בענן שמאפשרת ליצור, לבדוק ולפרוס אפליקציות מלאות בקלות ובמהירות, ישירות מהדפדפן. היא מוגדרת כסביבת "פול סטאק", כלומר גם פרונט-אנד (צד המשתמש) וגם בק-אנד (צד שרת - מה שעובד ברקע ומאפשר את התפקוד המתוחכם יותר של המערכות המקוונות).

Firebase Studio היא סביבת פיתוח מבוססת ענן סוכנית המסייעת לך לבנות ולשלוח אפליקציות AI מלאות באיכות ייצור, כולל ממשקי API, בק אנד, פרונט אנד, מובייל ועוד.

Firebase Studio מאחדת את Project IDX עם סוכני AI ייעודיים וסיוע מ-Gemini ב-Firebase, זאת כדי לספק סביבת עבודה שיתופית ונגישה מכל מקום, המכילה את כל מה שאתה צריך כדי לפתח אפליקציה. אתה יכול לייבא את הפרויקטים הקיימים שלך או להתחיל משהו חדש עם תבניות התומכות במגוון שפות ומסגרות.

מה נכלל בו? - ביחד עם צד-שרת, צד-לקוח ומובייל, יש גם API, שילוב בכלי של עוזר בינה מלאכותית (Gemini), תבניות מוכנות, תמיכה במגוון שפות ואפשרויות פיתוח ומסגרות ואינטגרציה עמוקה עם שירותי Firebase ו-Google Cloud.

היתרונות המרכזיים של Firebase Studio לעומת המתחרים:
- פיתוח מהיר גם ללא קוד, בזכות עוזר AI שמסייע בכתיבת קוד, תיקון באגים, בדיקות ותיעוד.
- סביבת עבודה אחידה בענן, עם כלים מובנים לאמולציה, בדיקות ופריסה ישירה.
- אינטגרציה מלאה עם שירותי Firebase (כמו Auth, Firestore, Hosting) ותמיכה בניהול נתונים ויזואלי.
- אפשרות להתחיל מפרויקטים קיימים או מתבניות מגוונות, עם שיתוף פעולה וניהול צוותים קל.
- מתאים גם למפתחים וגם למשתמשים ללא רקע תכנותי, בזכות ממשק ויזואלי וסוכן פרוטוטייפינג.

בקצרה: Firebase Studio מאיץ פיתוח אפליקציות ומפשט את כל שלבי העבודה, עם יתרון ברור בשילוב AI, ניהול בענן ואינטגרציה לשירותי Google.

#השימוש:
בשלב הראשון מעצבים את ה-UI של האפליקציה או האתר שרוצים לפתח. עושים את זה באמצעות Google Stitch שזה בדיוק מה שהיא עושה, באמצעות פרומפט פשוט טבמהירות רבה.

עכשיו על Firebase Studio עושים הרשמה ואז על כפתור Start שמימין למעלה, תצטרכו לאשר כמה דברים, במיוחד שאתם מסכימים לתנאים.

במסך העבודה תראו שדה מרכזי לכתיבת הפרומפט שלכם. אפשר לטעון ב-upload את תמונות המסך שיצרנו ב-Stitch.

מתחת לשדה הפרומפט יש שורה של סביבות פיתוח ושפות תכנות שאפשר לבחור ולייבא פרויקט מהגיטהאב שלכם, קוד קיים שתרצו לעבוד עליו, ביחד עם כלי ה-AI שיש כאן.

בצד ימין של שדה ה-URL יש לכם אייקון של מסך קטן (ליד הכוכב וזכוכית המגדלת). לחצו עליו והוא יתקין לכם את FIrebase Studio כתוכנה על המחשב, במקום לעבוד עליו בדפדפן. אם וכשעובדים עליו, יש לו את מה שצריך ובתפריט ה-3 נקודות יש פקודות הכרחיות, כמו להעתיק לינק ועוד.

בתחתית שדה הפרומפט יש כמה רעיונות להתנסות, כמו מחשבון וכדומה. לחיצה על אחד מהם תרחיב את הפרומפט לאיפיון של ממש. כך מסייעת המקצוענות של ה-AI לייצר לנו מהרעיון הפשוט את התכנית,האפיון שנוכל לפתח ממנו את האבטיפוס (Prototype), ההגדרות המקצועיות לפיתוח של מוצר ראשוני טוב. בחרו את אחד מהם, ראו איך הפרומפט שלו הופך לתכנית או האפיון וגם לו אפשר להוסיף הנחיות בפרומפט, עם תוספות, תיקונים ודיוקים.

כשהתכנית מוכנה, לוחצים על כפתור Prototype ורואים כיצד הוא מייצר את הקוד ומעלה בחלון הצד את האפליקציה. עכשיו אפשר לשפר ולפתח באמצעות המשך הדיאלוג, באמצעות פרומפטים (בצד ימין) לפיירבייס סטודיו.

מעל ה preview של מה שהוא בנה לכם יש אייקון קטנטן של עריכה, מתוך שלישיית אייקונים קטנים. אם תבחרו בו, תוכלו לכתוב פרומפטים ותיקונים לכל רכיב באתר ולשפר ולדייק אותו.

אגב, ליד האייקון הזה יש אייקון של לינק. לחיצה עליו תציג QR code שיעלה לכם את האפליקציה או האתר שיצרתם להפעלה בטלפון.

שימו לב שבצד יש לכם גם כפתור של "Edit the code". ואכן, אפשר להיכנס לכאן ולערוך בשפת התכנות את הקוד עצמו.

למטה יש לכם גם כפתור של Anotate שמאפשר להוסיף הערות עם חיצים לאובייקטים על המסך והם יתוקנו.

כדי לחזור למסך הראשי עם שדה הפרומפט הנקי, לחצו למעלה על "Firebase Studio". תחזרו לחלון הראשון, אבל שימו לב שיש לכם את הפרויקט ש"יצרתם" מימין לשדה הפרומפט. הוא נמצא באזור העבודה שלכם "My workspaces". תמיד תוכלו לחזור ולעבוד עליו או על יצירות אחרות שיהיו לכם. בתפריט ה-3 נקודות שלו אפשר למחוק אותו (ייפתח חלון ויש לרשום delete ולבצע), לשנות את שמו, לשתף עם אחרים ועוד.

#עבודה בשפת תכנות ספציפית
אם רוצים לפתח בשפה או סביבה מסוימת, למשל ב-React, בוחרים אותה בשורת השפות, ייפתח לכם חלון Workspace חדש שתגדירו ואתם מתחילים לעבוד בה, בצורה דומה לקודם (יש מגבלה כי גוגל נותנים רק 3 וורקספייסס חינם, אך ניתן למחוק את הקודמים ולפנות מקום לחדשים).

דבר נהדר הוא ללחוץ משמאל לשורת האפשרויות על "New Workspace" ולקבל אפשרויות של קטגוריות תוכנה והוא יציע אילו שפות מתאימות לזו שבחרתם. זה יקל מאוד את ההחלטות לגבי הסביבה של בניית האפליקציה החדשה שלכם. יש שם Web, Mobile, Database ועוד.

אם בוחרים React למשל, אז נותנים שם לפיתוח החדש, בוחרים TypeScript והוא מקים את סביבת העבודה, מאתחל את הסביבה ומייצר במהירות את מה שצריך בסביבה שמזכירה את סביבות הפיתוח המקצועיות (IDEs) כמו VScode.

כותבים את הפרומפט שרוצים. אפשר לבקש את סוג ומהות האפליקציה או האתר ואז את דרישות העיצוב, כמו:

I want to include subtle animations, nice colors and UI elements to make it attractive. Make sure the website is responsive, modern, sleek looking and minimalistic

בצד שמאל יש לנו את.......
שמאלי תחתון אלה אינטגרציות שאפשר עם מוצרי גוגל.

הכירו את פיירבייס סטודיו:

https://youtu.be/A6KZKH7Dga0

מדריך למתחילים בוויב קודינג:

https://youtu.be/pQMOzQHZWrE?long=yes

הדרך הכי קלה לעבוד איתו:

https://youtu.be/ru8XPZbumNo?long=yes

היכרות למפתחים שסאו מ-Cursor:

https://youtu.be/bnNXIUdqnt0?long=yes

פיתוח בפיירבייס סטודיו של גוגל (עד 2:51):

https://youtu.be/Rd6F5wHIysM?long=yes

הדרכה להתחברות לדטבייס:

https://youtu.be/C2P707v_gig?long=yes

פיצ'רים נהדרים בו:

https://youtu.be/-A3QkftCCPw?long=yes

מה זה סטוריבורד?

סטוריבורד (StoryBoard) בקולנוע הוא תיאור של השוטים המתוכננים לצילום, לרוב כשהם מצויירים על גבי נייר, כמו בקומיקס. מדובר בלוח תכנון שביצירתו יוצרי סרטים מקילים ומשביחים את תהליך הפרה-פרודקשן של הסרט.

בסטוריבורד מתוארים הצילומים המתוכננים מראש, בצורה ויזואלית, כדי לתאר את צילומי הווידאו או הפילם המתוכננים, עוד לפני הצילום.

המטרה של הסטוריבורד, בעברית "לוח סיפור", היא להקל על הבמאי ועל בעלי המקצוע השונים, בתכנון של צילומי הסרט.

הסטורי בורד מאפשר להבין את הסרט כפי שייראה על ציר הזמן, תמונה אחרי תמונה. הוא מסייע להמחיש את הסיפור, שוט אחרי שוט.

בעזרת הסטורי בורד ניתן לבדוק ולבקר מראש ובקלות רבה יותר דברים כמו מה עובד בסיפור ומה לא, לסמן כמה זמן ייקח כל שוט בסרט, לבחון האם הזרימה בין השוטים עובדת היטב והאם החיתוכים בין השוטים עובדים נכון.

בתור ייצוג גרפי של האופן שבו הסרט יתפתח, צילום אחר צילום, ייתכן שיצירת סטוריבורד נראה כמו שלב נוסף ואולי מיותר בתהליך הכנת סרט קצר או סרטון, אבל מדובר בשלב שמומלץ לעשות מה שניתן כדי לא לדלג עליו.

מקור השם "סטורי בורד" מגיע מהנוהג שהיה באולפני האנימציה הגדולים של פעם, לתלות איורים של כל שוט ושוט בסרט, על גבי לוח גדול על קיר האולפן. האיורים הללו איפשרו לצוות להתייחס לתכנית-העל של הסרט והוא היווה מעין מתכון להכנתו.

הנה דוגמה קצרה לסטורי בורד (עברית):

https://youtu.be/Rz1E0O3PSSw

מה זה סטורי בורד?

https://youtu.be/bpZjnH9wA4k

איך הסטוריבורד עובד?

https://youtu.be/6aTnEanIXBk

דוגמה לסטורי בורד מומחז בווידאו (עברית):

https://youtu.be/udK6HLxpaJE

הדרכה כיצד לעשות סטורי בורד, גם אם אינכם ציירים:

https://youtu.be/ux_Em1lVsjI

ויצירת סטוריבורד באמצעות כלי AI בסגנון של "Black and white sketch drawing style":

https://youtu.be/MKOG__oIe1o

איך יוצרים סרטים וסרטונים ב-AI?

כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.

וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.

וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.

מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.

היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".

וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...

אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?

הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.

הנה Google Veo 2 המוביל:

https://youtu.be/VNWLHAnRc0o

כך יוצרים סרט מדבר באמצעות Flow המדהים ו-Veo 3:

https://youtu.be/9nVEfjmDlVk

הכלי האינטגרטיבי שעושה תהליך שלם מפרומפט קטן:

https://youtu.be/Aw1TQwkCLQs

מודל וידאו בינתי ישראלי (עברית):

https://youtu.be/CkpLiPWLcHo

אפשרויות הווידאו AI שהולכות ומתפתחות במהירות - הנה Neurawik:

https://youtu.be/1HVkzZiv82Q

Sora רצה להחליף את עשיית הסרטים הרגילה (עברית)

https://youtu.be/kx3H1jFHncY

מדריך סורה שימושי וקצר ליצירת סיפור מתמשך:

https://youtu.be/oyRrQRRo4Uo

דברים שרק AI יכול לעשות (ללא מילים):

https://youtu.be/f-Vbm-iQ_Xw

הדרכה ל-Image to Video שהופכת תמונה לסרטון וידאו (עברית):

https://youtu.be/mR3rN8vphC8

קליפ AI של שיר של הביטלס:

https://youtu.be/Z9MZdNrGbM4

כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):

https://youtu.be/F-gl4E5yo60

כך יוצרים לייב פורטרייט - דיוקן עם מחוות שלכם:

https://youtu.be/kM3KSrPrh9c

קליפ מתמונה בשיטה של Image to video:

https://youtu.be/yCczY9PNeao

קדימון AI מדומה לסרט מד"ב שאולי יצולם:

https://youtu.be/oAIrJP4n5sQ

כך מחליפים פנים לדמויות וידאו ב-Faceswap:

https://youtu.be/vVs0DZ8VyGQ

מינימקס המטורף בווידאו AI:

https://youtu.be/4QXCV_TYKZc?long=yes

הנה Dream Machine של לומה:

https://youtu.be/N_hlfwWtgPQ?long=yes

על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:

https://youtu.be/APJAQoSCwuA?long=yes

Magic Hour AI - כלי שיוצר סרטונים עד 60 שניות, שזה הכי הרבה:

https://youtu.be/eSpuvmRhcPg?long=yes

KREA - מודל ליצירת סרטונים AI:

https://youtu.be/OBewafac0Xs?long=yes

MINIMAX - עוד מודל וידאו מדהים מסין:

https://youtu.be/7JZLLxV1AGc?long=yes

כלי וידאו שמייצר ישר סרטון רב-סצנות:

https://youtu.be/BCCUNiToo94?long=yes

כלי הווידאו המומלצים לתחילת 2025:

https://youtu.be/K04zRJ8Vl_s?long=yes

וכך מייצרים סרטי וידאו ארוכים ב-Canva תחילת 2025:

https://youtu.be/tWmVbn4rUd0?long=yes

מהם סוכני AI ומה הם עושים?

סוכני AI הם רכיבי תוכנה אוטונומיים, מבוססי AI, יישומים שנתמכים בבינה מלאכותית ומסוגלים לתפוס את סביבתם, לקבל החלטות ולנקוט פעולות להשגת מטרות ספציפיות עבורנו המשתמשים.

בשנת 2025 החלה תעשיית ה-AI במרוץ לפיתוח מה שנקראים בשפה הפופולרית "סוכנים חכמים" (AI agents), סוכני AI או LLM Agents.

אבל איך זה קורה?

סוכני AI הם עוזרים דיגיטליים בעלי יכולות לפתור בעיות. אלה לא מודלי שפה שעונים על כל השאלות האפשריות או מבצעים משימות מכל הסוגים, אבל באופן בינוני, אלא מנועי בינה ממוקדים, בעלי מומחיות ומצוידים ביכולות לשלב כלים שונים ואמצעים מגוונים בכדי להגיע לפתרונות ב"תחום מומחיותם", כלומר התחום שלשמו פותחו.

סוכני AI הם מנועי תוכנה מבוססי בינה מלאכותית שיכולים לבצע משימות באופן אוטונומי, כלומר עצמאי, בתהליך מעגלי ואיטרטיבי, כלומר עם תיקונים ושיפורים של כל שלב שלא השיג את מטרתו, עד להשגת התוצאה.

מטרתם של סוכני AI טובים היא לחקות את תהליכי התכנון והביצועים הכי טובים של בני אדם מוכשרים ומיומנים בתחומם ומעבר להם...

הבינה המלאכותית מאפשרת כיום לסוכן AI שכזה לבצע פעולות בעצמו. בניגוד לכלי GenAI שמתמקדים בדרך כלל ביצירה של תוכן כמו טקסט, תמונות, סרטונים ומוסיקה - הסוכנים החכמים, ה-AI Agents הללו, מיועדים לפתרון בעיות ממוקד ולביצוע של משימות מורכבות.

סוכן AI מבין שפה טבעית לחלוטין והתקשורת איתו פשוטה ורגילה ולא מחייבת מיומנות מיוחדת, מצידנו בני האדם.

סוכני ה-AI נקראים כך מכיוון שהם עושים את העבודה במקום המשתמש. הם יודעים לדמות התנהגות ויכולות אנושיות, אך בה בעת גם יכולות לא אנושיות. במילים אחרות, סוכני בינה כאלה ממירים את הידע של כיצד לעשות דברים ליכולת אמיתית לעשות אותם ולעשייה ממוקדת כזו, לפי צרכי המשתמש.

סוכנים בינתיים כאלו מאפשרים אוטומציות של פעולות מורכבות ותובעניות מבחינת זמן ובכך הם מביאים להחזר השקעה מהיר. לארגונים וחברות הם מאפשרים להגדיל את הצמיחה ולחסוך לטווח הארוך הרבה כסף. הם מחליפים ויחליפו בעתיד רופאים, מהנדסים, חוקרים ועוד בעלי מקצוע רבים.

סוכן ה-AI הוא המשך של הצ'טבוטים הוותיקים והעוזרים החכמים שעזרו לנו בעשור השני של המאה ה-21. הוא הופך את האינטליגנציה של הבינה המלאכותית לפעולה וליכולות ביצוע. הוא מבין את ההוראות שלך, מעבד את המידע הזה ומספקים את מה שביקשת - תשובה, פתרון, הסבר או עזרה בהשלמת משימה.

ברגע שהוא מוגדר היטב ומצויד בכלי ה-AI המתאימים, הסוכן החכם מטפל במשימות באופן מושכל ומדויק, מתכנן, מקבל החלטות ומבצע באופן אוטומטי פעולות מעייפות ושוחקות, לצד "עבודות שחורות". כך הוא משחרר את המשתמשים להתמקד בעניינים חשובים יותר.

כשהסוכנים החכמים הללו עובדים, כולנו מבינים שהמשימה תבוצע. בהתחייבות של AI. זו מהפכה שעומדת להיות מהפכה מטורפת ומובילי הטכנולוגיה חוזים שהאייג'נטים הללו, אותם סוכני AI, יהיו התוכנות החדשות, שהעולם יהיה מלא בהם.

אבל מיהם אותם סוכנים ומה בדיוק הם מאומנים ויכולים לעשות בשבילנו?

#מה זה סוכן AI?
אם AI באנגלית הוא ראשי התיבות של בינה מלאכותית, צריך להבין שבינה מלאכותית לכשעצמה היא מוח גולמי עם ים של פוטנציאל. אבל עד שלא נשאל אותה, עד שלא נבקש ממנה לעשות משהו ספציפי, ניתן לה תפקיד או משימה, היא לא תהיה ממש שימושית.

וזו בדיוק המשמעות של סוכן חכם, או סוכן AI. אם בינה מלאכותית היא גאון עם המון יכולת, אך סוג של "ראש קטן", סוכן AI הוא ביצועיסט, בינה מעשית שבאמת נותנת עבודה. יש לה יכולות מסוימות ומוגדרות והיא מתמחה בהן ורק בהן ואותן היא מבטיחה לבצע.

במילים פשוטות, האייג'נט עם ה-AI הוא עוזר וירטואלי חכם שמסוגל לבצע בעצמו משימות ספציפיות, תוך שימוש יעיל ביכולות הבינה המלאכותית. כמו ששעון מעורר יכול להעיר אותנו בבוקר, סוכני בינה ספציפיים כאלו יכולים לבדוק ולענות על המיילים שלנו, לקבוע לנו פגישות, לערוך קניות, למכור שירותים ומוצרים ללקוחות, לתכנן טיול או חופשה בחו"ל, חיפוש באינטרנט, הזמנת טיסות, למצוא לנו בדיחות לערב סטנדאפ בכיכובנו, או לנגן לנו מוסיקה לפי מצב הרוח שלנו.

כלומר, בזמן שבינה מלאכותית עניינה להיות חכמה נורא ולדעת הכל, הסוכן החכם עם ה-AI הוא הגרסה המעשית. הוא זה שמבצע משימות מוגדרות ומבצע אותן היטב. אפשר לדמות אותו למישהו מוכשר שמתגייס לצבא ואחרי שאומן לביצוע משימות מסוימות. הוא ממתין לפקודות שיקבל, או מבצע משימות לפי זמנים ותגובות, וכשהגיע הזמן לבצע את המשימה, או כשהוא מקבל פקודה לביצוע, הוא "עושה את מה שצריך" ומבצע וממלא את ההוראות.

#איך הם עושים זאת?
התשובה הכי קצרה היא: באמצעות ביצוע של משימות בצורה חכמה, עצמאית ויעילה.

סוכני AI מאומנים ומצוידים, כך שהם יידעו כיצד להגיב הכי טוב לדרישות, למצבים ולצרכים שונים. הם מבצעים את המבוקש מהם, לאחר שקיבלו הוראות מפורטות וגם נתונים שהם צריכים לקבל או לאתר.

סוכנים מצוידי AI נבנו כך שיהיו מסוגלים להבין דרישות, לחוש את המשתמש, לפרש נתונים, להבין את הסביבה, לקבל החלטות מושכלות ולבצע פעולות מורכבות יחסית - עד שיצליחו להשיג את המטרות שהוגדרו מראש.

כך מצליחים סוכני בינה מלאכותית כאלו להגביר את היעילות שלהם עבורנו, בני האדם. הם עושים זאת למשל, על ידי אוטומציה של משימות שגרתיות שמוטלות עלינו, מה שנקרא לא פעם "עבודה שחורה".

בכך מאפשרים הסוכנים הבינתיים הללו לעובדים האנושיים שאנחנו, להתרכז באסטרטגיה ויצירתיות.

מודלי השפה הרחבים (LLMs) שבהם הם מצוידים מאפשרים לאייג'נטים הללו לבצע משימות בצורה עצמאית ויעילה. עוד משולבים בהם מודלים מתקדמים לעיבוד שפה טבעית, מה שמאפשר להם להבין פרומפטים, הוראות, הנחיות וטקסטים בכתיבה טבעית. תוך יישום של טכניקות ניתוח מתקדמות כמו "העץ המחשבה" או "שרשרת המחשבה" (Chain of Thought) וביחד עם טכניקות ויכולות של למידת מכונה, הם יכולים להציע ביצועים מדהימים.

הסוכנים משפרים את הפרודוקטיביות, מפחיתים טעויות ומאפשרים שיתוף. חלקם ממלאים משימות מוגדרות מראש, אחרים עונים על שאלות, יש היכולים לתקשר בקול אנושי ולנהל שיחה רגילה. לעתים הם מתוכנתים לנהוג ולחשוב כאילו הם פקיד, מזכירה, מנהל חשבונות, מדענית, סוכן נסיעות או תחקירן - רבים מהם ספציפיים וממלאים משימה אחת היטב ואחרים ממלאים מגוון של משימות ואפילו בו-זמנית.

ההבנה היא שבאמצעות יכולת ניתוח של נתונים מורכבים ויכולת למידה מתמשכת הסוכנים החכמים הללו ימשיכו לפעול ולצבור ניסיון, תוך שהם הופכים ומתחדדים, לכלים נבונים ובעלי ביצועים טובים יותר ויותר.

#איך עובדים איתם?
אתם נכנסים לסוכן אינטליגנטי שאתם יודעים שמבצע משימה מסוימת ונותנים לו הוראות. מצידו, תהליך העבודה מתחיל בקבלת המטרה המוגדרת שנתתם לו. הוא מפתח במהירות הבזק תוכנית פעולה, בוחר את הכלים המתאימים לביצוע של המשימה שלא פעם הוא יפרק למשימות משנה וכאן מגיע ביצוע המשימות בפועל והערכה של התוצאות.

הכל מתבצע בצורה אוטונומית, מבלי להיעזר בכם. בדרך כלל הסוכן מסתמך על נתונים והקשרים שנאספו במהלך ה"שיחות" הקודמות שלכם ו"לומד אתכם" ומה הציפיות שלכם ממנו.

כי אחת התכונות החשובות של סוכני AI נעוצה ביכולת שלהם ללמוד ולהשתפר לאורך זמן. הם מנתחים כל הזמן את תגובותיכם והפעולות שלכם, לומדים מהמשוב שקיבלו מכם ומבצעים התאמות שישפרו את הביצועים שלהם. כך יכולים סוכני AI להתפתח ולהתאים את עצמם לצרכים המשתנים שלכם ולהגיב טוב ומדויק יותר למגוון רחב של צרכים וסיטואציות.

סוכן ה-AI מגיש לכם את התוצאות ואתם מוזמנים להמשיך ולנהל איתו דיאלוג. אפשר לבקש ממנו הרחבות ושיפורים. תוכלו גם להכניס שינויים בבקשה המקורית או עדכונים, להטיל עליו לבצע פעולות שישפרו את הדיוק למה שיתאים לצרכים שלכם וכך הלאה.

#דוגמאות?
האפשרויות כמעט אינסופיות. כבר היום יש סוכנים חכמים רבים. יש מהם שיכולים לבצע חישובים, לחפש באינטרנט, להבין תמונות, לנתח מסמכים מורכבים, לגשת למאגרי מידע ולהפעיל המון כלים נוספים.

יש סוכנים שנותנים תשובות על שאלות בתחומים שונים כמו משפטים או מיסים, אחרים בונים תכנית טיול שמותאמת לבקשותינו ולכלל המשתנים, יש שמזמינים כרטיסים להופעות או מקומות במסעדות, אחרים מנסחים טקסטים וכדומה.

בבית חכם יכול AI אג'נטי לשלוט בתאורה, בחימום ובאבטחה - על ידי שילוב עם מערכות אחרות, במטרה ליצור סביבת מגורים נוחה וקלה.

יש מהם שמבצעים אוטומציות שעושות בשבילך את העבודה, ממיינות את המיילים או מטפלות ב-To do list, כלומר ניהול המשימות האישי ועוד.

סוכני AI ייעודיים אחרים מפיקים טקסטים מותאמים אישית, למטרות כמו אימיילים, דו"חות, קורות חיים וחומרי שיווק. יכולותיהם מתגלות במיטבן כשהם מצליחים להתאים את רמת האוטונומיה שלהם, בהתאם לצרכים של המשתמשים ומטרותיהם.

הנה מדריך קצר ליצירת סוכן AI או אווטומציות:

https://youtu.be/ZPRU2-UvJtU

הסבר פשוט ולעניין של סוכני ה-AI:

https://youtu.be/wazHMMaiDEA

הבשלת היכולות של סוכנים חכמים מצוידי AI היא תוצאה של שנות התפתחות רבות:

https://youtu.be/WftLJZw6Cf8

צריך לתת סיכוי לסוכני AI חכמים (מתורגם):

https://youtu.be/xq8Ws1jyBX4

כך יוצרים סוכן AI בכלי שנקרא n8n:

https://youtu.be/6DLZK7XDOGo

סוכן AI לפיתוח כלי תוכנה ואפליקציות רשת:

https://youtu.be/aWBiZc5XKJM

הצ'טבוט המתקדם של Open AI שמשמש מתורגמן:

https://youtu.be/c2DFg53Zhvw

הכירו את ה-Projects של קלוד לבניית ושימוש בסוכני AI (עברית):

https://youtu.be/8mWR1r28ia4

הנה הסבר מקיף של סוכני ה-AI החדשים:

https://youtu.be/S9dc0y_Zesc?long=yes

#MindPal - בונה האוטומציות וסוכני AI הפשוט והיעיל ביותר, שגם מאפשר למכור או לשתף את התהליכים שיצרתם בו:

https://youtu.be/7y8LxKaa8YQ?long=yes

הדגמת GPT 4o שהופך לסוכן AI ומסוגל לעשות פעולות שונות בשירותך:

https://youtu.be/DrKkKLEditU?long=yes

והסוכן הסיני המדהים ל-1 באפריל:

https://youtu.be/v2Ur_DgaEEI?long=yes

מהי מולטי מודאליות בעולם ה-AI?

זה אחד הפיתוחים המרגשים של עידן הבינה החדש ומה שמרגיש לא פעם כמו סרטי מד"ב מהיותר מתוחכמים. קוראים לזה מולטי-מודאליות (Multimodality) והוא בעצם היכולת של כלי AI לעבוד עם סוגי נתונים שונים, כמו טקסט, אודיו, קוד, וידאו ותמונות - גם כקלט וגם כפלט.

במקום להתמקד בסוג אחד בלבד של נתונים, מערכת רב-מודאלית מקבלת ומנתחת מידע ממקורות מגוונים, בכדי לקבל הבנה מעמיקה יותר של העולם הסובב אותה. מדובר בכלי ממוחשב שבדיוק כמו שבני אדם חווים את העולם דרך כל החושים והחוויות, לא רק מבין טקסט, אלא גם רואה תמונות וסרטים, מעבד ומנתח וידאו, מגלה הבנה מרחבית, שומע קולות וצלילים, מפענח קוד של תוכנה ומסוגל גם ליצור תכנים ותוצרים בכל המדיות הללו.

בדומה למוח האנושי, המשלב בטבעיות מידע מכל החושים, העולם של המערכות המולטי מודאליות ב-generative AI מציג יכולת שהיא עוד רכיב במהפכה הגדולה של מערכות בינה מלאכותית, מהפכונת שמאפשרת לעבד ולשלב כמה סוגי מדיה במקביל.

המערכות החדשות הללו מצוידות בשכבות מורכבות של פענוח ומפענחות את העולם פחות או יותר כמו מחשב-על. דוגמאות לא חסר. למשל עם צ'טבוט שבזכות ההבנה המרחבית המשופרת שלו מסוגל לזהות ולהוסיף כיתוב מדויק לעצמים שונים בתמונות עמוסות פריטים. או צ'טבוט שמנתח תמונות ומאפשר למשתמש לנהל עליהן דיון, או סוקר אינפוגרפיקה ונותן לה פרשנות קולית רלוונטית, בהתאם לרמת ההבנה של המשתמש או קהל היעד המבוקש. לכלי כזה יש גם כלי וידאו שמקבלים תמונה והנחייה כתובה (פרומפט) ומנפישים את התמונה לקליפ וידאו שכמו צולם בידי צוות צילום הוליוודי.

דוגמה נוספת היא כלי אינטראקציה רב-מודאלי כמו NotebookLM. הוא מאפשר למשתמשים לשתף איתו את המסך או המצלמה שלהם בזמן אמת. כך ניתן לקיים שיחות קוליות דמויות אדם, תוך כדי שמאפשרים ל-AI לצפות במסך ולעזור, תוך כדי מודעות להקשר ולתוכן.

אפילו תכונת זיהוי הפנים בסמארטפון שלכם היא תכונה שמשלבת היטב ראייה ממוחשבת, מיפוי תלת-ממדי ועיבוד נתונים מתקדם. ומאלה היא יוצרת פיצ'ר מדהים, בצד חווית משתמש פשטותה כמו מבט של שומר אנושי.

שילוב של צורות נתונים מרובות, כמו טקסט, תמונות ואודיו לתוך מערכת מאוחדת ורב-מודאלית היא שמאפשרת למודלים כמו Claude או GPT-4 לכתוב קוד כשמזינים לתוכו דיאגרמה ולמודלים שונים ליצור תמונות או סרטוני וידאו עם תיאורים.

את המהפכה המולטימודאלית אפשר לזהות בקלות בפלטפורמות כמו טיקטוק (TikTok) ואינסטגרם (Instagram), בהן משלבים סוגי מדיה מגוונים ומעבדים במגוון כלים, המשנים את הדרך בה אנו מספרים את הסיפור שלנו לעולם.

הנה הסבר היכולת המולטי-מודאלית:

https://youtu.be/97n1u66Shgg

כך עובדים מערכות מולטי מודאליות:

https://youtu.be/WkoytlA3MoQ

וההיפר מודאליות החדשה של גוגל מארינר:

https://youtu.be/KeUMm1xF3o0?long=yes

מהו המחשב המלחין?

המחשב IAMUS הוא מחשב שמלחין מוסיקה. IAMUS שהתוכנה שבו יוצרת מנגינות, הרמוניה ומרקמים מוסיקליים נעימים לאוזן, נבנה בידי מדענים באוניברסיטה של מאלגה בספרד.

אם היה מבחן טיורינג ליצירתיות, מעניין אם המוסיקה של המחשב יאמוס הייתה מסוגלת להטעות אנשים מיומנים לחשוב שהיא נכתבה בידי בני אדם. כלומר, האם מלחין וירטואלי היה מצליח להתחזות למלחין בן אנוש..

כמובן שיאמוס המחשב אינו יצירתי כמו בן-אנוש. בשלב הזה הוא בעיקר יודע לבצע את פעולת ההלחנה, על פי הכללים ה"נכונים" שאותם יודע כל מלחין מיומן שלמד וקיבל השכלה מוסיקלית. לגבי היופי והמקוריות של המוסיקה שיוצר המחשב הזה, יש מחלוקת רבה עד כמה הוא "יצירתי".

הכירו את מבחן לאבלייס שבוחן אם מכונה אכן ממציאה רעיונות מוסיקליים בעצמה (מתורגם):

https://youtu.be/Rh9vBczqMk0

למידת מכונה שמסייעת ליוצרים לחבר מקצבים ומהלכים בהיפ הופ:

https://youtu.be/mOjWyRqiDds

הבה נחקור את תוכנת IAMUS של המלחין הממוחשב:

https://youtu.be/KhiupLtyibs

הנה יצירה של יאמוס לקלרינט סולו:

https://youtu.be/FCsbEY9pxTU

להרכב קאמרי:

https://youtu.be/Uq3iKbCNDCM

קטעים מהתקליטור הראשון של יאמוס עם מוסיקה שלו:

https://youtu.be/cv4y_BRJokM

מדריך מגניב להלחנה בעזרת קבצי MIDI שיוצר ChatGPT:

https://youtu.be/tV82Wy-tXRE?long=yes

וכלי AI שמלחין מוסיקה בסגנון יוהן סבסטיאן באך:

https://youtu.be/na2ZOUfUwbs?long=yes

איך ה-AI ייקח לנו את העבודה? ואיך למנוע?

בפשטות כן. אולי לא בכולנו ולא בכל אנשי המקצוע אבל הבינה המלאכותית תוכל לגרום לקשיים עבור רבים - בעבודה ובעולם התעסוקה. באופן מסוים, היא עלולה להביא את העולם אפילו למשבר כלכלי של ממש.

אלא אם... חכו עוד מעט.

בשלהי שנת 2022 כל העולם דיבר לפתע על הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer.

מודל השפה שעליו התבססו המפתחים בחברת Open AI נקרא GPT-3, אבל גרסה 4 ואלו שאחריה לא יאחרו והמירוץ לפתח אותו ומודלים רבים אחרים יימשך. כי במקביל לעבודה המדהימה שעושים מפתחי Open AI פותחו די מהר כלים מתחרים.

ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.

אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך בעיניים עצומות על הידע והמידע שהם מציעים לנו, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות.

#אז הלך עלינו?
הבינה המלאכותית שמפגינים ChatGPT ושאר כלי ה-GPT יכולה לעשות בהצטיינות עבודות של איסוף ומיון של מידע או ידע (שני דברים שונים) ואחרי זה גם כתיבה ויצירה.

כי ה-AI ברמה הגבוהה הזו יודעת לחקות אמנות, לצייר, לתקן תמונות, למצוא תשובות לשאלות, להכין שיעורי בית, להמציא מתכונים, לכתוב עבודה לבית הספר, לחבר מוסיקה, לערוך וידאו, לכתוב קוד ולתכנת, לחבר טקסטים, לנסח מכתבים ומאמרים ועוד.

אבל היא יודעת בעיקר ליצור דברים דומים למה שכבר נעשה. אמנם ברמה גבוהה, אפילו מאוד, אבל על סמך חשיבה מקצועית וסטנדרטית של אנשי מקצוע בתחומים השונים.

#או שתצודו, או שתהפכו למזון
על אימוץ ה-AI ההכרחי בימינו אנו נוהגים היום לומר שהוא לא מומלץ אלא מחויב המציאות. אמצו את הכלים הללו, צברו ניסיון אמיתי בתפעול שלהם, הכניסו אותם לפעילות היום יום שלכם, בבית, בעבודה, בחיים ובתכניות שאתם עושים.

זו הזדמנות שצצה אחת לדור והזמן הוא עכשיו.

משתלם היום אף יותר מבעבר לפתח את היצירתיות והחשיבה המקורית, ללכת על להיות קצת יותר אמן מידע מסתם מידען, להיות מעט פחות מהנדס "רגיל" ויותר מהנדס או מתכנת שממציא ומוצא פתרונות, כולל באינטרנט אבל לא רק - כי פתרונות לתחום אחד ניתן ליישם לא פעם בתחומים אחרים.

נמשיך? - להיות יותר סופר מאשר עיתונאי, יותר מלחין מאשר רק נגן ויותר מעצב מאשר גרפיקאי ביצועיסט. יותר יזם מאשר מקבל הוראות מאחרים.

#מה הבינה לא תהיה?
בתחום היצירה הבינה המלאכותית לא תשתווה לאנשים יצירתיים, מקוריים, שיסטו ממה שכולם יודעים לעשות ויחוללו את הפלאים שלהם. היא תדע לעשות טוב יותר ומהר יותר את מה שאנשי מקצוע טובים עושים, אבל היא תתקשה לצאת מהטוב אל המצוין, הגאוני, המבריק.

לכן היא לא תפגע, לפחות בשנים הקרובות, באנשי מקצוע מעולים ומקוריים, בבני אדם יצירתיים, עם חשיבה מיוחדת ולא שבלונית, עם יכולת המצאה.

#יכולות?
לשם כך דרושות יכולות מגוונות שמערכת החינוך והעולם המקצועי לא מפתחים יותר מדי. יצירתיות, ידע כללי, סקרנות וחוצפה הם חלק מהיכולות הללו.

יצירתיות - הציצו אצלנו בתגית "יצירתיות" והבינו את הצד הזה ואיך לפתח אותו. התחלה מעולה לרכישת ידע כללי תהיה באאוריקה, בהאזנה לפודקסטים, צפייה בסרטי דוקו וידע, עיון בבלוגים של ידע, אלו שנמצאים באזור המסקרן והלא משעמם של האינטרנט ובתנאי שהוא גם מתויג, מקושר, רב-תחומי ולא חד-ממדי.

סקרנות - גם היא תכונה שנולדתם איתה וכדאי לשמר, במיוחד כשמסביבכם כמעט כל גוף חינוכי רשמי ינסה להשבית לכם אותה, לטובת חיפוש תשובות סטנדרטיות ושתהיו ותנהגו "כמו כולם". כל דבר שתלמדו לבד ותחקרו כי הוא מעניין אתכן, אין ספק שתזכרו טוב יותר ויום אחד עשוי לשרת אתכם, לעומת שיעורי בית שכמעט אף פעם לא.

היזהרו מתופעה שבעולם החינוך מוכרת כ"Yessing". חיפוש חשובות שהמורה יאהב, אותן תשובות לשאלות שניתן למצוא בקלות ואפילו בלי חשיבה. אז מה הטעם בהן? לא עדיף שישאלו אותנו בבית הספר מעט פחות שאלות, אבל כאלה שיעודדו אותנו להשתמש בשתי האונות או בכל אזורי המוח? חקרו כאן את תגית "סקרנות".

חוצפה - על זה לא צריך להרחיב אבל נדגיש שמדובר בחוצפה מקצועית ולא התנהגותית. להעז ולא לומר לעצמכם שאינכם יודעים מספיק כדי לפתח או להמציא, לחבר או לצייר. פשוט ללכת על דברים, לחקור איך, לאסוף דרכים, לחפש שיטות וטכניקות לאמנות וליצירה ביד, ליצירת דברים שאומרים לכם שלא ניתן לבצע.

נסו להמציא שיטות חדשות לעשות דברים וחקרו אותן, לנסות לעבוד איתן. חפשו ידע ושאלו באינטרנט עד שתקבלו תשובות. כתבו דברים כי לא פעם רק כשכותבים מבינים. זה בסדר לגנוב ולהעתיק ואז לפרק, ללמוד, להרכיב מחדש, לעבד ולהבין כיצד לשלוט במיומנויות הכרחיות. אם אין זמן אז קומו שעתיים קודם או לכו לישון מאוחר, גם אם תהיו קצת עייפים בבית ספר. גם ככה הלימודים בו, אתם יודעים...

כישלונות - עוד דבר שיעזור ויהיה הכרחי הוא היכולת שלא להיבהל מכשלון ואפילו ללמוד לחבק אותו. חינכו אותנו שההצלחה היא המטרה, בעוד שמה שמתקשר אצל רובנו עם כישלון הוא כמעט תמיד אכזבה ופנים נפולות. אז כדאי שתדעו שכישלונות הם חלק בלתי נפרד מההצלחה.

היכולת שלא להרפות וליפול ברוח מהכשלון היא שמבדילה בין בני אדם. היא שמביאה נשים ואנשים בסופו של דבר להצלחה. אדיסון, מגדולי הממציאים, אמר על זה פעם שההמצאות הגדולות שלו היו כולן כשהוא לא הצליח להיכשל...

כדאי להאמין לו. אמר את זה אדם שחתום על מאות פטנטים והמצאות ששינו לחלוטין את העולם. בשום מקום לא נכתב כמה פעמים הוא נכשל בכל תהליך, עד שהוא הצליח בו. תמיד מספרים רק על ההצלחות אז אנחנו לא יודעים על הקשיים והנפילות, על התסכול וההפסדים.

אבל עכשיו אתם יודעים. לכן אם אומרים לך שזה גרוע? - אל תרפי והמשיכי. צעקו לך בוז? - המשך. כמעט כל מצליחן ופורץ דרך שמע את זה בהתחלה. על בוב דילן אמרו שיש לו קול של צפרדע, המטוסים של האחים רייט צללו בזה אחר זה, הבכורה של "כרמן", האופרה הכי פופולרית בהיסטוריה, הסתיימה בקריאות בוז וירקות שהושלכו על הבמה. את הסרט "בלייד ראנר" קטלו כשהוא עלה לאקרנים ואת סוקרטס הוציאו להורג על השחתת הנוער.

אז אמרו... מה הם יודעים? מי מהמבקרים והפוסלים הללו הצליח במשהו כזה?

לא להרפות! אין הבטחות, אבל עקביות חשובה לא פחות מחשיבה, יצירתיות, סקרנות ומקוריות. בלעדיה כמעט ואין סיכוי להגיע למימוש כי לא מגיעים בכלל.

#אתם הורים?
אם אתם מגדלים היום את ילדיכם יש לכם אחריות ואפשרויות. תנו להם כלים, יכולות, הרימו ותפתחו את הכשרונות המלבלבים שלהם. אל תכבו אותם עם הרגיל ועם מה שאתם למדתם או רציתם להיות. בעולם שלהם אתם תהיו מבוגרים מדי או, וסליחה שאנחנו מזכירים, אולי כבר לא תהיו.

תנו להם לחקור מה ירצו לעשות. חישפו אותם לתחומים, לעולמות ולתופעות. תנו להם דוגמה אישית, קראו ספרים, אל תעשנו, אל תהיו בטטות - צאו לעשות ספורט ואם כבר אז גם אכלו נכון. צאו איתם לטבע, לטיול או הליכה, הביטו יחד בפרחים, נסו לזהות אותם ולחקור עליהם.

קראו ספר בעצמכם והביאו את הספריה של הבית לסלון, אל מול עיניהם. כבו מדי פעם את הטלוויזיה ונהלו שיחות ביניכם אל מול עיניהם ואיתם. שתפו אותם, שאלו על מה מעניין אותם ומה ירצו להיות, מה החלומות שלהם, איפה הם רואים את עצמם בגיל 25.

התעניינו בהם באמת. מה מסקרן אותם. מה מרגש ומלהיב בשבילם. התעניינו איזה חוג הכי מעניין אותם ואם אין מספיק כסף בקשו בשקט הנחה כדי שלא לבייש אותם.

נסו להשיג להם דברים שיאפשרו להם לפתח את תחומי העניין, לקנות יד שנייה, לחנך אותם שחדש זה ממש סתם ואם ראו משהו זרוק שלא יתביישו לקחת, לפרק ולהרכיב ממנו חללית. צפו איתם בתכניות מדע או בסרטי דוקו, הראו להם סרטים קלאסיים, למדו אותם ששחור לבן הוא לא פחות צבעוני ושמינימליזם הוא לא פעם הכי עשיר שיש (Less is more).

אה, ובגיל צעיר ספרו להם סיפור לפני השינה. זה כל כך חשוב שאתם לא מעלים על הדעת. הרבה יותר מ-GPT, מציור בינתי וממדעי המחשב באוניברסיטה. היו הורים, לא רק אנשי קריירה.

הנה ChatGPT ולמה בחינוך מודאגים ממנו:

https://youtu.be/Fn8jDanbf0c

בעלי מקצוע מפחדים על העבודה שלהם (עברית):

https://youtu.be/0AGYOv0sGHg

תראו למשל איך הוא מייצר קליפים (עברית):

https://youtu.be/8CmXtj5gW2I

במבט לעתיד, השינוי שה-AI ייצר הוא אדיר ותלוי גם בנו (מתורגם):

https://youtu.be/RzkD_rTEBYs

איך הצ'אט GPT בניתוח קוד? (עברית)

https://youtu.be/Z46pqHFuKHs

בחיוך - מה הכלי היחידי שיש לנו כבני אדם כדי לזהות אם הכותב או הדובר הוא בוט כמו ChatGPT? (עברית)

https://youtu.be/nes_xZjZweY

מה קורה כששואלים את הבינה של גוגל על זה (עברית):

https://youtu.be/oh4Bq8ifgK4?long=yes

זה יקרה בשלבים ולא מיד:

https://youtu.be/iNKFOCki42I?long=yes

וסרטון שמדגים את זה יפה:

https://youtu.be/5rqVB44kIv0?long=yes

מהם ומה עושים הפרמטרים במודלי AI?

פרמטרים בלמידת מכונה (Machine Learning parameters), אם רוצים להבין מהם, אז כדאי לחשוב עליהם בתור המשתנים שקובעים את איכות ה"חשיבה" של מודל AI.

תפקידי הפרמטרים במודל שפה הם להבין הקשרים מורכבים בשפה, לחזות את המילה הבאה ברצף הטקסט שמפיק המודל ובסופו של דבר להצליח לייצר טקסט קוהרנטי (הגיוני) ומשמעותי.

אגב, במקום במילים זכרו שהטקסטים נבנים באמצעות טוקנים - ראו בתגית "טוקנים".

אבל עכשיו, אחרי שהסברנו בפשטות, הבה נפרט יותר ונרד לאיך זה נעשה: פרמטרים הם שלוכדים את הקשרים הסטטיסטיים שבין מילים ומושגי שפה שנמצאו בנתוני האימון. אפשר לדמות אותם למעין "כפתורים" בתוך המודל, שניתן לכוונם בכדי לשפר את יכולת המודל לעבד ולייצר שפה אנושית ומרשימה כל כך.

דמיינו שהידע על השפה מזוקק לתוך הפרמטרים ואז, בדומה למערכת סאונד שבה טכנאי הקול מכוונן את הכפתורים כדי להשיג את איכות הצליל הטובה ביותר, מהנדסי ה-AI מכוונים את מיליארדי הפרמטרים כדי להגיע לאיכות הגבוהה ביותר של התוצרים שהמודל ייצר.

בעצם, פרמטרים במודלים של בינה מלאכותית הם בקרי הגדרות פנימיות במודל שניתן לכוון במהלך האימון ועל ידי כך לשפר את יכולתו לעבד ולייצר שפה, תשובות ותגובות טובים יותר.

כלומר, ככל שיש במודל שפה יותר פרמטרים, גדלה גם חוכמתו ויכולתו לעשות שימוש במגוון המידע שנאגר בו. באמצעות הפרמטרים שולטים המהנדסים ברמה בה מודל AI מבין ויוצר שפה.

במהלך האימון, ערכי הפרמטרים מכוונים ומתעדכנים כדי לקודד דפוסים ממערכי הנתונים העצומים עליהם מאומנים המודלים הללו. הפרמטרים לוכדים את הקשרים הסטטיסטיים בין מילים ומושגי שפה שנמצאו בנתוני האימון. עבודה טובה איתם מאפשרת חשיבה טובה ומורכבת יותר ושימוש יותר מוצלח בידע שהמודל צבר, מה שיאפשר תגובות ותוצרים מדויקים יותר.

אגב, מספר הפרמטרים משקף בדרך כלל את גודל המודל. מודלים גדולים יותר יכולים להבין או לתפוס מורכבויות רבות יותר של שפה. מצד שני, הם גם יקרים יותר להפעלה, דורשים כוח מחשוב רב יותר ויש להם השפעה סביבתית רבה יותר, שהיא המחיר שאנו משלמים על כל ה-AI הזה.

אבל חשוב להבין שמספר הפרמטרים אינו המדד היחידי ליעילות המודל. לא פחות חשובה היא איכות הנתונים שעליהם אומן המודל. מודל קטן יותר שאומן על נתונים איכותיים יותר עשוי לבצע את המשימות טוב יותר ממודל גדול יותר שאומן על נתונים פחות מוצלחים.

כלומר, חיבור של כמות הפרמטרים, לצד איכות האימון, רמת הדאטה שעליו אומן המודל והיעילות הכוללת שלו הם המפתח ליכולות של מודל שפה.

הנה הפרמטרים במודל AI ואיך הם משתלבים בתמונה הכללית:

https://youtu.be/mnqXgojQCJI

פרמטרים וטוקנים הם לא הכל במודלים:

https://youtu.be/a1nqXQMOCks

והפרמטרים כחלק מהבינה היוצרת בכללה:

https://youtu.be/r17HV0TzAWw?long=yes

מהם ההבדלים בין UX ו-UI, חווית משתמש וממשק משתמש?

לא כולם מצליחים להבין את ההבדלים שבין חווית משתמש, המכונה באנגלית הייטקית UX, לבין עיצוב ממשק משתמש שנקרא UI.

UX הוא התכנון של חווית המשתמש במוצר (קיצור של User Experience), בעוד UI הוא העיצוב הגרפי-ויזואלי שאותו חווה המשתמש, ממשק המשתמש (User Interface), על כל מרכיביו, כולל צבעים, פונטים, כפתורים, תפריטים וכדומה.

נציג את ההבדלים בצורה פשוטה. אם הפעלתם פעם אפליקציה חדשה והיא לא הייתה נוחה לשימוש, או אפילו מבלבלת ומסובכת - ה-UX כשל. אם העיצוב שלה היה מזעזע, מכוער, בצבעים של בית חולים, פונט משונה או עיצוב שלא תואם את העניין שלה - מישהו ב-UI צריך לתת את הדין...

אז כן - ההבדלים בין חווית משתמש UX וממשק משתמש UI הם ההבדלים שבין המתכננים, אנשי ונשות ה-UX לבין המסגננים, נשות ואנשי ה-UI.

#UX
בשלבי אפיון חוויית משתמש מתבצעים המחקר של צרכי והתנהגות המשתמשים ובהמשך התכנון והאפיון של המוצר.

התכנון של חווית ממשתמש כולל את התכנון העיצובי שיעניק חוויית שימוש טובה במוצר. בנוסף הוא כולל שיקולים של נגישות, מסע המשתמש, ארגון המסכים ועוד.

מהי חווית שימוש טובה? - כשמחצר מעוצב בצורה שבה נוח למשתמש וחיית השימוש שלו היא חיובית ואף מהנה עבורו, אז חוויית המשתמש היא מוצלחת.

מאפייני UX טובים יודעים לתכנן מערכות מורכבות שעדיין יהיו מוחות, נעימות ואפילו מהנות למשתמשים.

#UI
עיצוב ממשק משתמש UI אחראי על הממשקים מול המשתמש (UI פירושו User Interface, בעברית ממשק משתמש).

כלומר מעצב UI מעצב את הנראות של המוצר, ה"לוק אנד פיל" שלו. הוא קובע את הסגנון, הסטיילינג אם תרצו, האסתטיקה, על הצבעוניות שלה, הפונטים בהם משתמשים וכו'.

הנה עולם ה-UI/UX (עברית):

https://youtu.be/oc_rWRwtwn8

מה זה UX?

https://youtu.be/-L4gEk7cOfk

מטרת מעצבי ה-UX:

https://youtu.be/j4VflEcvlxo

שלבי הפיתוח של חווית המשתמש וממשק המשתמש (עברית):

https://youtu.be/Q5763pPchvw

הרצאת וידאו קצרה על ההבדלים (עברית):

https://youtu.be/kYtXXGzWENg

ויצירת UI בעידן ה-GenAI והפרומפטים:

https://youtu.be/M-uUFLU9IFU?long=yes

מהו שרת MCP בעולם ה-AI ומה הוא משפר?

שרת ה-MCP מיועד לשדרג מנועי AI או LLMs משלב הצ'אט לאפשרות של שליטה בכלים חיצוניים על המחשב שלנו. למעשה, הוא מכוון להתחבר בשמנו כמשתמשים, לכלים ותכנים מהעולם הפרטי שלנו, במחשב או בענן ולעשות עליהם פעולות AI מדהימות ומגוונות.

MCP, ראשי התיבות של Model Context Protocol, הוא פרוטוקול שיצרה בנובמבר 2024 חברת אנתרופיק, המפתחת של מנוע השפה המצוין Claude. הפרוטוקול אומץ על ידי חברות רבות, כולל המתחרות הגדולות אנתרופיק, דוגמת openAI, מפתחת ChatGPT.

באמצעות MCP, הצ'אטבוט יכול להיכנס למתכונים שבגוגל דרייב ולשלוף אותם משם, באופן חכם למשימה שמטילים עליו, למשל להכין עוגה. כלומר, פרוטוקול ה-MCP הוא שמאפשר את החיבור של ה-LLM אל המשאב, במקרה הזה המאגר שבגוגל דרייב ובמקרים אחרים המחשב הפרטי או מחשבי הארגון שלנו.

עבור משתמשים מן השורה, השימוש ב-MCP הוא בדרך כלל שקוף לחלוטין. כלומר, הם לא מודעים לקיומו כשהם מפעילים סוכן AI או עוזר אישי, המבצעים דברים עבורם. זה גם לא מעניין את המשתמש שהחיבור לדברים שה-LLM עושה מתבצעים באמצעות הפרוטוקול הזה. מי שיודעים את זה הם המתכנתים שמשתמשים בו כדי לבנות מוצרים חדשים שבהם היכולות שלו נחוצות.

מהצד המסחרי, MCP יכול להאיץ מאוד את קצב פיתוח המוצרים מבוססי ה-LLM. הכוונה היא לא רק לצ'אטים, אלא גם למוצרים רבים אחרים. למשל, מוצרי אבטחה שונים שיכולים להציע התערבות בזמן אמת בגלל פעילות חשודה של משתמשים ושימושים שונים במערכות לוגיסטיות — במערכות כאלה היה אתגר משמעותי בחיבור של LLM שמפעיל או קורא למשאבים, והאתגר הזה נעשה קל יותר כשיש פרוטקול כזה. הנמכת הרף לחיבור בין LLM לבין משאבים שונים פותחת את הדלת למוצרים חדשים שיכולים להיווצר במהירות.

הרעיון הוא בעצם שניתן לגרום ל- AI לא רק לשוחח איתנו ולענות על שאלות או לצ'טט ולייצר טקסטים וקוד, אלא ממש לייצר ולפעול עם תוכנות במחשב, להשתמש בהן ובכך לסייע לנו בביצוע פעולות מורכבות, להחליף אותנו בביצוע של משימות עבודה משעממות ובגדול - לשדרג את התפקוד שלנו מבלי לגזול יותר זמן.

שרת mCP או mCPAI הוא בעצם פרוטוקול הקשר של מודל בינה מלאכותית (model context protocol). אפשר לחשוב על זה כמערכת פלאג-אין אוניברסלית ל-AI שמאפשרת לו לפעול בעולם החיצון, עם גישה לתוכנות, כלים, אתרים, קבצים, מסדי נתונים ועוד.

עם MCP יש לנו כלי שמאפשר פתאום ל-AI לעשות פעולות כמו שליחת מיילים, הודעות לווטסאפ, קידוד בתוכנה שאנחנו רגילים, שליטה בכלי אוטומציה חיצוניים או להעלות פוסט לפייסבוק, ציוץ לטוויטר וכדומה.

עוד אפשרות היא להתחבר לשירותים שישלימו את יכולות התשובות של מודל בינה. זה יכול לעזור, למשל במקרים של שאלות או צרכים שהידע שלו לא מספיק בכדי לקבל מענה או תפוקה מספקת או ממש טובה.

בפשטות, הרעיון הוא שאם יש לנו שרת mCP על המחשב, זה אומר שהבינה המלאכותית שלנו יכולה לבצע משימות מפרכות, יומיומיות או סתם עבודה שחורה במקומנו. לכתוב דו"חות, לתכנן טיול עם Google Maps, לטפל במסרים שקיבלנו, ליצור פלייליסטים ב-Spotif, לשלם חשבונות וכך הלאה.

עם שרתי mCP אתם בעצם נותנים למודל הבינה חיבור לאינטרנט וארגז כלים שלם שמאפשר לו לבצע משימות מורכבות או תובעניות מבחינת זמן. השרתים האלה יכולים לפעול על המחשב שלנו, באופן מקומי, או מול שרתים בענן - אבל עדיין בשליטתנו.

ואגב, מובן שהעניין החדש הזה מגדיל גם את סיכוני האבטחה למוצרים מבוססים LLM. אם עד עתה הסיכון המשמעותי בצ'טבוטים היה להזיות או מידע שגוי, מיס-אינפורמציה, מעתה, כשכלי בינתי מקבל גישה לעשיית דברים בפועל, נפתחים בפניו גם אפשרויות תקיפה חדשות.

דוגמאות? - דמיינו האקרים או מפתחים שיגרמו ל-LLM לבצע פעולות שונות בקבצים מקומיים, או לגשת למאגרי מידע סגורים ולעשות שם פעולות תוקפניות. MCP מספק לתוקפים אפשרויות והזדמנות חדשות ולכן, סביר שדי מהר יצוצו חברות שיציעות הגנה מכל אלה.

מכל מקום, המהפיכה הטכנולוגית הזו מייצרת שרתי mCP חדשים בקצב מטורף וכל יום נכנסים שחקנים חדשים לזירה.

זהו ה-MCP וכך הוא עובד:

https://youtu.be/5ecTQ5e-pSg

הסבר של שימושי MCP בעולם הבינתי:

https://youtu.be/UG5yHP_Zx-8

יצירת MCP למתכנתים:

https://youtu.be/MC2BwMGFRx4

מה ההבדל בין MCP ל-API?

https://youtu.be/qYChSSP8TTA

והסבר מקיף של MCP (עברית):

https://youtu.be/HMYYJZrOpz0?long=yes

מה בין מודל היגיון, מולטי מודאליות ושרשרת מחשבה?

בעולם המתהווה ממש לנגד עינינו יש לעתים בלבול בין טכנולוגיות, מושגים ורעיונות שונים. הבה נבהיר את ההבדלים ביניהם:

#מולטי מודאליות (Multimodal Model)
זוהי תכונה של מודל שפה שיכול לקבל סוגי קלט שונים ולהתייחס אליהם, במקום רק טקסט, כמו מודלי השפה הרגילים או הראשונים שהכרנו בהתחלה. הרעיון במודלים מולטי-מודאליים כאלו הוא שהם משלבים כמה סוגי נתונים או מודאלים, כולל טקסט, תמונות, הקלטות, אולי סרטונים וכדומה.

דוגמה לכך היא מודל ה-Multimodal Chain-of-Thought (בקיצור CoT), שמציע גישה בה המודל משתמש בשני שלבים: הראשון הוא יצירת רציונלים, הסברים, והשלב השני של הסקת תשובות. השילוב של מידע טקסטואלי עם מידע חזותי מאפשר למודלים אלו לשפר את ביצועיהם ולצמצם את כמות ה"הזיות" (hallucinations) בתשובותיהם. פירוט בתגית "מולטי מודאליות".

#מודל היגיון (Reasoning Model)
מודל היגיון, מודל מחשבה או מודל חשיבה, הם שמות שונים של מודל שנועד לחקות את תהליך החשיבה האנושית. הוא מתמקד בהסקת מסקנות לוגיות על בסיס מידע נתון, ולא רק בהפקת תשובות מהירות.

מודלים אלו מבצעים לעיתים קרובות "שרשרת מחשבה" (Chain of Thought), כלומר הם חושבים צעד אחר צעד כדי לפתור בעיות מורכבות, כמו בעיות מתמטיות או מדעיות. זה מאפשר להם להסביר את הפתרונות שלהם בצורה ברורה ומדויקת יותר. פירוט בתגית "מודל היגיון".

#שרשרת מחשבה (Chain of Thought)
ה-Chain of Thought ובקיצור CoT, הוא טכניקת הפעלת מודלים שבה המודל מונחה לפרק בעיה סבוכה ומורכבת ולייצר רצף של צעדי חשיבה קטנים, לפני שהוא מספק תשובה.

שיטה זו, המחקה את דרך הפעולה האנושית, שיפרה את יכולות ההיגיון של מודלים גדולים והוכחה כיעילה בביצוע משימות שונות כמו חישובים, רציונליזציה של מצבים יומיומיים, ופתרון בעיות סימבוליות.

המודל מתבסס על דוגמאות קודמות כדי להנחות את החשיבה שלו, מה שמוביל לשיפור משמעותי בביצועים. פירוט בתגית "שרשרת מחשבה".

#סיכום
אז נסכם שמולטי מודאליטי או מולטי מודאליות משלבת סוגי נתונים או קלט שונים ולא רק טקסט ובכך משפרת ביצועים.

מודל היגיון, או חשיבה, בסמוך, מחקה את החשיבה האנושית ומספק הסברים לוגיים לתשובות שהוא נותן, בעוד שחשיבה מדורגת, או שרשרת מחשבה, היא טכניקה שמסייעת ומנחה מודלים לחשוב על בעיות בצורה מסודרת, לפני שהם נותנים את התשובה.

שלושת המושגים הללו קשורים זה בזה, כי מודלי ההיגיון יכולים להשתמש בטכניקות של חשיבה מודרגת (Chain of Thought) ולא פעם משולבים בהם אמצעים מולטי-מודאליים כדי לנצל את היתרונות של כל אחד מהם.

איך מאמנים מכונות ובאילו שיטות הן לומדות?

למידת מכונה מתבססת על יצירה של מודל גדול. המודל עצמו הוא אכן אוסף גדול ומורכב של מספרים, שמייצגים מידע, כלומר דאטה שהוזן למודל מהעולם האמיתי כקלט (Input).

המספרים הללו מייצגים את פריטי הקלט המסוים ומגדירים קשרים מתמטיים ביניהם. על ידי אימון מתמיד של המודל, הוא הולך ומזהה את הקשרים הללו כדפוסים, שיהיו מוכנים כמעין ידע שהוא למד, לקראת שימוש בו, להצגת תחזיות, מענה לשאלות, חישובים של בעיות שנפנה אליו וכדומה.

#תהליך האימון
לפני וכדי שמודל יוכל לענות על שאלות או להציע תחזיות יש לאמן אותו. ממש כמו מאמן כושר או מפקד טירונים בצבא, שמקבלים אימון, הוא יקבל אוסף של נתונים, דאטה שיעמוד לרשותו, כדי שיוכל לזהות את אותם דפוסים. זה חייב להיות קלט (Input) עצום וגדול, כלומר המון נתונים, Big Data.

כדי לאמן מודל אנחנו נותנים לו אוסף של קלטים. הקלטים הללו ישתנו לפי סוג ומטרת המודל, אך המטרה הבסיסית, העליונה והתמידית שלו תהיה למצוא את הדפוסים בדאטה, כך שהוא יוכל ליצור תחזיות טובות ולתת תשובות טובות וללא הֲזָיוֹת (Hallucinations).

#שיטות אימון
למידת מכונה מתבצעת בכמה שיטות שונות, שכל אחת מחייבת "שיטת הוראה" שונה. ישנם 3 סוגים של למידת מכונה: למידה ללא פיקוח, למידה מפוקחת ולמידת חיזוק.

- למידה לא מפוקחת - היא למידת מכונה הלומדת באמצעות זיהוי עצמי של קווי דמיון ודפוסים וללא הנחיה אנושית.

- למידה מפוקחת - מתבססת על אימון בינה מלאכותית באמצעות דוגמאות מסומנות. כלומר, למידה שמסתמכת על קלט מבני אדם כדי לבדוק את דיוק התחזיות.

- למידת חיזוק - מתבססת על אימון בינה מלאכותית באמצעות ניסוי וטעייה. כלומר, מדובר בלמידה מחוזקת משמשת לתוכניות טיפול, תוך איסוף משוב באופן חוזר ונשנה (איטרטיבי) והשוואה מול הדאטה המקורית של כל פרופיל, כדי לקבוע את הטיפול היעיל ביותר לו.

כאשר מודלים אלה הופכים לעצמם, קשה יותר לקבוע את תהליך קבלת ההחלטות שלהם, מה שיכול להשפיע על העבודה, הבריאות והבטיחות שלנו.

#דוגמה
הנה דוגמה מהעולם הרפואי של רופאים והמטופלים שלהם:

בלמידה ללא פיקוח נוכל להשתמש כדי שהמודל יזהה קווי דמיון בין פרופילי מטופלים שונים ויאתר דפוסים שמתעוררים אצלם, כשהוא עושה זאת ללא הדרכה אנושית וללא פיקוח של רופאים ומומחים.

למידה מפוקחת, לעומת זאת, תסתמך על הקלט של הרופאים שיבצעו את האבחנה הסופית ויבדקו את הדיוק של חיזוי האלגוריתם. כלומר כאן המכונה תלמד מהמומחה, גם מהאבחנות המוצלחות שלו אך גם משגיאותיו. אם יוזנו למכונה נתונים של 2 קבוצות, חולים ובריאים, היא תזהה בעצמה מאפיינים שמשותפים לחולים במחלה מסוימת ושאינם נמצאים אצל אנשים בריאים. לאחר השוואה בין תחזיות המכונה לאבחון הסופי של המומחים, המכונה תלמד לזהות את התסמינים של המחלה ולסייע לרופאים לאבחן אותה נכון בעתיד.

למידת חיזוק תשמש לתכניות טיפול, בגישה איטרטיבית, תהליך חוזר ונשנה בו יוזן למכונה, שוב ושוב, המשוב החוזר על ידי הרופאים. המשוב יהיה לגבי יעילות התרופות, המינונים השונים ולגבי הטיפולים היעילים יותר ופחות, כך שהמודל ישווה יעילות של התרופות, המינונים והטיפולים לדאטה של החולה ויסיק מסקנות שיאפשרו לו לחזק בעתיד את הטיפולים המוצלחים והייחודיים יותר, אלו שיתאימו לפרופילי חולים, עם מאפיינים ומקרים שונים, לאור תגובות חולים משתנות, נסיבות שונות של המחלה ומצבי המחלה המגוונים לאורך הטיפול.

כלומר, החוקרים יכולים להשתמש במערכות למידת המכונה הללו ביחד, כדי לבנות מערכות בינה מלאכותית.

אבל - ויש כאן אבל משמעותי - יש לשים לב שככל שהמודלים הללו מכוונים באופן עצמאי, יהיה קשה יותר לקבוע כיצד האלגוריתמים השונים מגיעים לפתרונות שלהם, מה שיכול להיות בעל השפעה משמעותית על העבודה, הבריאות והבטיחות שלנו, בני האדם, כשאנו משתמשים בהם. לכן, באימון של מודלים גדולים (LLMs) משתמשים לרוב בכל השיטות הללו במקביל, כשלא פעם הן מאמנות אחת את השנייה.

הנה אימון מכונה פשוט (עברית):

https://youtu.be/CC-TGXxc-Go

כך המכונה לומדת ומדוע כדאי לשלב שיטות אימון שונות (מתורגם):

https://youtu.be/0yCJMt9Mx9c

וכך האלגוריתמים לומדים (מתורגם):

https://youtu.be/R9OHn5ZF4Uo?long=yes

מהם טוקנים ב-AI ולמידת מכונה?

מאסימוני הטלפונים ועד עולם אבטחת מערכות מחשוב, טוקן (Token), בעברית “אסימון”, הוא מושג המשתנה בהתאם להקשר שבו הוא מוזכר. אפילו בתוך עולם המחשבים יש למושג טוקן כמה שימושים.

בלמידת מכונה, אחת הזירות המרתקות של העידן המודרני והתחום בו פועלים מודלי השפה הפופולריים של ימינו, כמו Claude או ChatGPT, לטוקנים יש משמעות אדירה.

אותם מודלים גדולים, LLMs, הם מודלים מתמטיים. כדי לבצע את המשימות שאנו מבקשים מהם, תוך כדי תקשורת איתם בשפה טבעית, כמו אנגלית, עברית וכדומה, הם משתמשים בתהליך שנקרא "טוקניזציה" (Tokenization).

במרכז הטוקניזציה נעשה פילוח של הטקסטים שהמודלים הללו מקבלים כנתונים, כדאטה, ליחידות קטנות יותר, תרגום של חלקי המידע הקטנים למספרים, כשאת יחידות המידע הללו, שהומרו למספרים, הם ינתחו בהמשך.

כך, אחרי שמסתיימת הטוקניזציה, הם מייצרים מהמידע טוקנים, מספרים שכל אחד מהם מייצג פריט מידע קטן. ה"טוקן" משמש בהם בתפקיד "אסימון למידת המכונה", שמתאר באופן מתמטי את יחידות הטקסט הקטנות. אלה מעין יחידות מידה שהמודלים המוכרים יוצרים מהקונטקסט.

לאחר שסיימו להפוך את המידע לטוקנים, מרבית המודלים שאנו מכירים הטוקנים משמשים לייצוג של הטקסט, ביחידות קטנות שהמודל מעבד בצורה מתמטית.

כשאנו משתמשים בטוקנים, זה כדי לסייע למודל להבין את המבנה של הטקסט, כך שיוכל לבצע על פיו את החישובים שלו. טוקן אחד יכול להיות כל חלק ממילה בשפה הרגילה שלנו, או אפילו תו אחד.

כדי להבין ולהגיב לקלט, המודל משתמש בכמות מסוימת של טוקנים. וטוקן יכול להיות כל פיסת מידע, מתו בודד ועד מילה שלמה ולעתים גם יותר. יש שיטות שונות של טוקניזציה והבחירה ביניהן היא בהתאם לאלגוריתם בו משתמשים. יש שהאסימון הוא לפי תווים (Character tokenization), אסימון לפי מילים, לפי משפט, ביטויים, טוקניזציה לפי מילת משנה ולפי מספר.

בשיחה על מודל AI (ה-LLM, כמו ChatGPT או Claude) משמש הטוקן לציון גודל השיחה על המודל והיקף המידע שיכול להיות בה. לכל מודל יש מגבלה של זיכרון התוכן שהוא יכול לעבד בשיחה אחת ולהתבסס עליו בתשובות שלו ובמהלך השיחה.

כל הטקסט שהמודל מכיל ובא מהקלט שמזרים לו המשתמש, כולל השאלות והתשובות וכל מידע נוסף, כל אלו מכונים "קונטקסט" (Context), כלומר "ההקשר".

חלון ההקשר (Context window), או "חלון הקונטקסט", מייצג את כמות התוכן שהמודל יכול לעבד בשיחה עם משתמש. הכמות הזו נספרת בטוקנים. אם קלוד, למשל, תומך ב-200 אלף טוקנים, זה אומר שהשיחה יכולה לכלול כ-40 אלף מילים. אם לג'מיני של גוגל יש מיליון טוקנים, זה אומר פי 5 יותר מילים וגודל חלון הקונטקסט שלה, כלומר השיחות עם ג'מיני הוא של כ-2 ספרים ממוצעים.

גם מהירויות של מודלים מודגמת לא פעם בטוקנים לשנייה. לא נדיר לראות השוואת מהירויות כמו "מודל ה-Sonar החדש של Perplexity מגיע לביצועים של עד 1200 טוקנים לשניה, בהשוואה ל-75 טוקנים לשניה בלבד של המודל Claude 3.5 Sonnet" או 140 טוקנים לשניה של Gemini 2.0 Flash של גוגל".

טוקניזציה כפי שהיא נעשית בידי מדעני נתונים:

https://youtu.be/fNxaJsNG3-s

פרמטרים וטוקנים הם לא הכל במודלים:

https://youtu.be/a1nqXQMOCks

הסבר של Machine Learning Token באנגלית:

https://youtu.be/mnqXgojQCJI

וטוקניזציה באתרי אינטרנט שיכולה לשמש בהקשר אחר כאמצעי אבטחה:

https://youtu.be/Y7I4IDojhJk

מה היתרון של כלי פיתוח קוד מבוססי AI?

איך יוצרים ב-AI ציורים ותמונות בסגנונות אמנות שונים?

איך וייב קודינג מעביר את התכנות לשפה טבעית?

מה זה RAG בבינה מלאכותית?

אילו מקצועות ייפגעו מהבינה המלאכותית הגנרטיבית?

מה זה NLP או עיבוד שפה טבעית ב-AI?

מה זה UBI שישמור בעתיד על מובטלי ה-AI?

מהי טכנולוגיית הדיפ נוסטלגיה?

מהי טפשת ה-AI שתפגע באיכות התוכן והקוד?

מהם מודלי שפה גדולים, או LLM?

מהם סרטוני דיפ פייק ומה הבעיה בהם?

GenAI

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!