שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.
»
«
מה עושה הפרומפט בעולם הבינה המלאכותית הגנרטיבית?
מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?
זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.
בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.
היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.
זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.
#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.
יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.
#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:
פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:
ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".
שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.
בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').
הסבר כמו למתחיל - בקשו בפרומפט כך:
"Explain [subject] in simple terms. Explain to me as if I'm a beginner."
כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):
https://youtu.be/joJVqKTPVsY
השיעור הראשון בניסוח הפרומפט:
https://youtu.be/Qos2rG3zVAM
איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):
https://youtu.be/zFS7WtovYmo
יש תוכנה לעזרה בניסוח פרומפטים (עברית):
https://youtu.be/HLhRFaXQ0vQ
על הפרומפט שמייצר חדשות קוליות לגיק:
https://youtu.be/5TlsXXTamBs
מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:
https://youtu.be/pZsJbYIFCCw
הנה מקצוע מהנדס הפרומפט:
https://youtu.be/Bq-ncjOGeVU
עצות וטיפים לפרומפטים ושיחות עם צ'טבוטים (עברית):
https://youtu.be/R4E_lc_2wtY?long=yes
והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:
https://youtu.be/hd7l9F3n4ZM?long=yes
מהם מנועי תמונות ובינה ויזואלית ב-AI?
הבינה המלאכותית היצירתית (GenAI) כמו DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצרת AI, לציירת, צלמת ועוד כל מיני סוגי אמנים - אבל במקרה שלה - תמיד באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימי-בייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ואפילו מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E קמו די מהר מתחרים איכותיים לא פחות ואף יותר. הם מציעים עולם חדש וחסר תקדים של ציירים בינתיים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד המנועים השונים פועלים, אבל זו עבודה מדהימה של למידה עמוקה שמעבדת בעצמה את הדאטה ממיליוני תמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית ותחרות של חברות ומפתחי קוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין. השטח מלא במודלים שבראשם מידג'רני, אידיאוגרם ו-Flux, המודל בקוד פותח שמייצר תוצרים שומטי לסתות.
הנה כלי Gen AI מצטיין ליצירה ויזואלית:
https://youtu.be/XZjaHJP0PQE
באיזה כלי לבחור לכל צורך? (עברית)
https://youtu.be/a5wUS6SQ0us?t=1m47s
"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:
https://youtu.be/qTgPSKKjfVg
על היכולת המופלאה של דאלי ליצור אמנות:
https://youtu.be/hiSgpZUAy2c
הסבר אמנות ה-AI:
https://youtu.be/alJdw4JDJ4o
מנועי יצירת תמונות מתחרים:
https://youtu.be/rGbNJrywLhk
גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):
https://youtu.be/KR29znIp2LU
ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:
https://youtu.be/G-Wsh1vUeVQ
קבלו משפר פרומפטים ליצירת תמונות (עברית):
https://youtu.be/HLhRFaXQ0vQ
מדריך להרחבת תמונות:
https://youtu.be/V1KLG159A2s
קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:
https://youtu.be/VR3AWdyVVdU
למה יש לבינה כל הזמן בעיה עם אצבעות?
https://youtu.be/24yjRbBah3w
גם למחוללי תמונות מעולים כמו מידג'רני יש בעיות (עברית):
https://youtu.be/xUpUhHsAWlg?long=yes
הסבר מעמיק וארוך על יצירת תמונות גנרטיבית (עברית):
https://youtu.be/aHPFq-Q6JQ0?long=yes
ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:
https://youtu.be/FRClNMC_z-s?long=yes
מהי המוסיקה שיוצר ה-AI?
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
ההבטחה של Fugatto של אנבידיה:
https://youtu.be/qj1Sp8He6e4
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
Riffusion - הכלי החדש ליצירת מוסיקת AI (עברית):
https://youtu.be/c5_agjg-_Q4?long=yes
ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
ואיך עובדים עם סונו 4:
https://youtu.be/5zYHm35V998?long=yes
איך יוצרים סרטים וסרטונים ב-AI?
כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.
וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.
וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.
מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.
היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".
וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...
אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?
הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.
הנה Google Veo 2 המוביל:
https://youtu.be/VNWLHAnRc0o
הכלי האינטגרטיבי שעושה תהליך שלם מפרומפט קטן:
https://youtu.be/Aw1TQwkCLQs
מודל וידאו בינתי ישראלי (עברית):
https://youtu.be/CkpLiPWLcHo
אפשרויות הווידאו AI שהולכות ומתפתחות במהירות - הנה Neurawik:
https://youtu.be/1HVkzZiv82Q
Sora רצה להחליף את עשיית הסרטים הרגילה (עברית)
https://youtu.be/kx3H1jFHncY
דברים שרק AI יכול לעשות (ללא מילים):
https://youtu.be/f-Vbm-iQ_Xw
הדרכה ל-Image to Video שהופכת תמונה לסרטון וידאו (עברית):
https://youtu.be/mR3rN8vphC8
קליפ AI של שיר של הביטלס:
https://youtu.be/Z9MZdNrGbM4
כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):
https://youtu.be/F-gl4E5yo60
כך יוצרים לייב פורטרייט - דיוקן עם מחוות שלכם:
https://youtu.be/kM3KSrPrh9c
קליפ מתמונה בשיטה של Image to video:
https://youtu.be/yCczY9PNeao
קדימון AI מדומה לסרט מד"ב שאולי יצולם:
https://youtu.be/oAIrJP4n5sQ
כך מחליפים פנים לדמויות וידאו ב-Faceswap:
https://youtu.be/vVs0DZ8VyGQ
מינימקס המטורף בווידאו AI:
https://youtu.be/4QXCV_TYKZc?long=yes
הנה Dream Machine של לומה:
https://youtu.be/N_hlfwWtgPQ?long=yes
על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:
https://youtu.be/APJAQoSCwuA?long=yes
Magic Hour AI - כלי שיוצר סרטונים עד 60 שניות, שזה הכי הרבה:
https://youtu.be/eSpuvmRhcPg?long=yes
KREA - מודל ליצירת סרטונים AI:
https://youtu.be/OBewafac0Xs?long=yes
MINIMAX - עוד מודל וידאו מדהים מסין:
https://youtu.be/7JZLLxV1AGc?long=yes
כלי וידאו שמייצר ישר סרטון רב-סצנות:
https://youtu.be/BCCUNiToo94?long=yes
כלי הווידאו המומלצים לתחילת 2025:
https://youtu.be/K04zRJ8Vl_s?long=yes
וכך מייצרים סרטי וידאו ארוכים ב-Canva תחילת 2025:
https://youtu.be/tWmVbn4rUd0?long=yes
מהי הבינה המלאכותית גנרטיבית שיודעת לייצר תוכן?
בינה מלאכותית גנרטיבית (Generative AI), בעברית "בינה מלאכותית יוצרת", היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.
התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד.
#הבינה היוצרת יודעת לעשות 3 דברים עיקריים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.
התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה (ראו בתגית "פרומפטים").
לפרומפטים הללו מתווספים לעתים ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר למתחילים. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח עם מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI ומבוצעות מיד.
ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.
בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה (בצירוף עובדים שלא יתעדכנו לחידושי ה-AI). לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.
אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".
הנה הסבר על הבינה הגנרטיבית:
https://youtu.be/rwF-X5STYks
הבינה היצירתית והתחומים שהיא עתידה לשבש:
https://youtu.be/vneJieU5qlg
היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):
https://youtu.be/05oOucZmO8Y
התפתחות התחום הגנרטיבי כפי שהוא מוצג באחת מאלפי חברות Generative AI (עברית):
https://youtu.be/joJVqKTPVsY
מהי בינה גנרטיבית?
https://youtu.be/pWNAtUwnBS8
משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:
https://youtu.be/3Jopz-V-IRQ
הנה הסבר מעמיק על הבינה המלאכותית היוצרת:
https://youtu.be/2IK3DFHRFfw?long=yes
אוסף חידושי וחדשות AI וידאו מדצמבר 2024:
https://youtu.be/30ZoRlr-TrY?long=yes
וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:
https://youtu.be/2IK3DFHRFfw?long=yes
מה עושים כלי מחקר ועיון מבוססי AI?
כלי מחקר מבוססי בינה מלאכותית ג'נרטיבית הם סוג של סוכני AI משוכללים (AI agents) המיועדים לחקר וארגון המידע שאנו צוברים בתהליך המחקרי.
מבין מודלי השפה הגדולים (LLMs) בולטים קלוד ו-Chatgpt שפותחו לכלים מולטי-מודאליים. ככאלה הם מתאפיינים ביכולת ללמוד דברים מטקסטים, תמונות, צילומי מסך ועוד ולשפר את הביצועים עם תוצאות בפלט הכולל טקסטים, קוד, אודיו, וידאו, תמונות והבנה מרחבית.
לצידם יש מודל שפה שהוא יותר מחקרי באופיו וכולל מנוע חיפוש. מדובר ב-Perplexity, כלי שהחל בהתבססות על דאטה מחקרי, בעיקר מ-Google Research. כשהפך להיות הצ'טבוט המחפש הראשון, הוא מתבסס על תוכן עדכני ורלוונטי שהוא מאתר באינטרנט בזמן אמת, עם עדיפות לתמציתיות ולנתוני אמת. בנוסף, פרפלקסיטי שומר על כללי הציטוט המדעי, נותן ציטוטים עם ציוני מקור, מנמק ומקשר את טיעוניו למקורות שעליהם התבסס ומהם שאב את המובאות והתשובות.
יש גם את NotebookLM של גוגל, מעין מחברת חכמה בצירוף שותף ללמידה, שמבין אתכם ועוזר להפיק את המרב מהחומר המחקרי או הלימודי. במקום לבזבז זמן על עבודה טכנית ומשעממת, מעלים אליו עשרות חומרים, כולל טקסטים בהעתק-הדבק, מאמרים, לינקים, כתבות וספרים ועד סרטוני יוטיוב והקלטות קוליות. הכלי, שמתבסס על Gemini 2.0, קורא, מבין ומנתח את כל המידע במהירות ובמקום שתבזבזו שעות על קריאת חומר וכתיבת סיכומים, הוא מייצר לכם בקלות סיכומים חכמים, תובנות, מדריכי למידה, צירי זמן ותשובות לכל שאלה. ניתן לצ'טט או ממש לשוחח עם המחברת כאילו היא עוזר אישי וקולי, לשאול שאלות שתרצו על החומר ולקבל תשובות מדויקות ומובנות.
מרשימה גם היכולת של NotebookLM, להפוך את הידע שטענתם אליו לפודקאסט וגם לשאול שאלות עם מיקרופון ולהיות שותפים מלאים לשיחה עם "המגישים". תארו לעצמכם שתוכלו לקחת את הסיכום שיהפוך להרצאה מוקלטת בקול אנושי לחלוטין, או לסרטון לימודי או מקצועי. זו למידה חווייתית, שיתופית ומעניינת הרבה יותר.
עוד כלי מחקר טובים הם עזרי כתיבת פרומפטים ומאגרי פרומפטים המסייעים לתקשורת יעילה עם מודלים גדולים של שפה. כלים כאלה הם חיוניים למגוון עצום של שימושים, כולל שלל אפשרויות מחקר, כתיבה והפקת תובנות מתוכן גולמי וממקורות בינתיים.
ברמה המדעית יש גם יש כלי בינתי, מעין מודל שפה גדול (LLM) בשם Consensus שהוא בעצם מנוע חיפוש אקדמי מבוסס בינה מלאכותית. הוא עצמו משתמש במודלי שפה גדולים (LLMs) כדי לאסוף, לנתח ולהנגיש מידע מדעי בצורה פשוטה ומדויקת. המנוע של "קונצנזוס" מנתח יותר מ-200 מיליון מאמרים מדעיים, מסכם אותם באופן תמציתי ומציג את הקונצנזוס המדעי, מה הדעה הכללית ביחס לשאלות מדעיות בנושאים שונים. לשם כך הוא משתמש בכלים כמו "Consensus Meter", בו רואים את התפלגות הדעות בשאלה המסוימת ולומדים על "מה חושב המדע" לגביה.
עוד שיטה שהוא נוקט היא "Pro Analysis". שימושיה העיקריים בחינוך ובמחקר הם בסיוע לסטודנטים ולמורים במציאת מאמרים רלוונטיים, יצירת סיכומים מותאמים לשואל, ניתוחים מהירים של ספרות מדעית, סינון מאמרים שלא עומדים בדרישות מדעיות מוגדרות (כמו מתודולוגיה, גודל מדגם או מובהקות סטטיסטית) והפקה של ציטוטים אוטומטיים ודוחות מותאמים.
הנה NotebookLM, כלי המחקר לטעינת חומרים מגוונים ומשימות עליהם (עברית):
https://youtu.be/_vML22ACIRs
הוא יכול לייצר אפילו פודקסט:
https://youtu.be/1jgpsGDUXW4
הצ'טבוט שמצטיין במחקר ובחיפוש - Perplexity (עברית):
https://youtu.be/1MkBWfurQL4
כלי AI מקצועי למחקר מדעי בסקירת ספרות ולמידה ממאמרים:
https://youtu.be/LBzrVEG5qsk
מארינר - סוכן AI והעוזר הגלובלי של גוגל:
https://youtu.be/WJnUWldjJQA?long=yes
הבן של גוגל וקלוד - הנה פרפלקסיטי ששילב את שני העולמות (עברית):
https://youtu.be/33nBpKRWMms?long=yes
כמה כלי מחקר מבוססי AI:
https://youtu.be/Rc9R7T8S1c8?long=yes
ומדריך לעבודה עם NotebookLM:
https://youtu.be/UG0DP6nVnrc?long=yes

מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?
זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.
בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.
היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.
זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.
#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.
יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.
#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:
פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:
ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".
שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.
בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').
הסבר כמו למתחיל - בקשו בפרומפט כך:
"Explain [subject] in simple terms. Explain to me as if I'm a beginner."
כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):
https://youtu.be/joJVqKTPVsY
השיעור הראשון בניסוח הפרומפט:
https://youtu.be/Qos2rG3zVAM
איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):
https://youtu.be/zFS7WtovYmo
יש תוכנה לעזרה בניסוח פרומפטים (עברית):
https://youtu.be/HLhRFaXQ0vQ
על הפרומפט שמייצר חדשות קוליות לגיק:
https://youtu.be/5TlsXXTamBs
מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:
https://youtu.be/pZsJbYIFCCw
הנה מקצוע מהנדס הפרומפט:
https://youtu.be/Bq-ncjOGeVU
עצות וטיפים לפרומפטים ושיחות עם צ'טבוטים (עברית):
https://youtu.be/R4E_lc_2wtY?long=yes
והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:
https://youtu.be/hd7l9F3n4ZM?long=yes

הבינה המלאכותית היצירתית (GenAI) כמו DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצרת AI, לציירת, צלמת ועוד כל מיני סוגי אמנים - אבל במקרה שלה - תמיד באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימי-בייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ואפילו מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E קמו די מהר מתחרים איכותיים לא פחות ואף יותר. הם מציעים עולם חדש וחסר תקדים של ציירים בינתיים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד המנועים השונים פועלים, אבל זו עבודה מדהימה של למידה עמוקה שמעבדת בעצמה את הדאטה ממיליוני תמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית ותחרות של חברות ומפתחי קוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין. השטח מלא במודלים שבראשם מידג'רני, אידיאוגרם ו-Flux, המודל בקוד פותח שמייצר תוצרים שומטי לסתות.
הנה כלי Gen AI מצטיין ליצירה ויזואלית:
https://youtu.be/XZjaHJP0PQE
באיזה כלי לבחור לכל צורך? (עברית)
https://youtu.be/a5wUS6SQ0us?t=1m47s
"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:
https://youtu.be/qTgPSKKjfVg
על היכולת המופלאה של דאלי ליצור אמנות:
https://youtu.be/hiSgpZUAy2c
הסבר אמנות ה-AI:
https://youtu.be/alJdw4JDJ4o
מנועי יצירת תמונות מתחרים:
https://youtu.be/rGbNJrywLhk
גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):
https://youtu.be/KR29znIp2LU
ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:
https://youtu.be/G-Wsh1vUeVQ
קבלו משפר פרומפטים ליצירת תמונות (עברית):
https://youtu.be/HLhRFaXQ0vQ
מדריך להרחבת תמונות:
https://youtu.be/V1KLG159A2s
קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:
https://youtu.be/VR3AWdyVVdU
למה יש לבינה כל הזמן בעיה עם אצבעות?
https://youtu.be/24yjRbBah3w
גם למחוללי תמונות מעולים כמו מידג'רני יש בעיות (עברית):
https://youtu.be/xUpUhHsAWlg?long=yes
הסבר מעמיק וארוך על יצירת תמונות גנרטיבית (עברית):
https://youtu.be/aHPFq-Q6JQ0?long=yes
ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:
https://youtu.be/FRClNMC_z-s?long=yes

המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
ההבטחה של Fugatto של אנבידיה:
https://youtu.be/qj1Sp8He6e4
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
Riffusion - הכלי החדש ליצירת מוסיקת AI (עברית):
https://youtu.be/c5_agjg-_Q4?long=yes
ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
ואיך עובדים עם סונו 4:
https://youtu.be/5zYHm35V998?long=yes

כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.
וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.
וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.
מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.
היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".
וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...
אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?
הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.
הנה Google Veo 2 המוביל:
https://youtu.be/VNWLHAnRc0o
הכלי האינטגרטיבי שעושה תהליך שלם מפרומפט קטן:
https://youtu.be/Aw1TQwkCLQs
מודל וידאו בינתי ישראלי (עברית):
https://youtu.be/CkpLiPWLcHo
אפשרויות הווידאו AI שהולכות ומתפתחות במהירות - הנה Neurawik:
https://youtu.be/1HVkzZiv82Q
Sora רצה להחליף את עשיית הסרטים הרגילה (עברית)
https://youtu.be/kx3H1jFHncY
דברים שרק AI יכול לעשות (ללא מילים):
https://youtu.be/f-Vbm-iQ_Xw
הדרכה ל-Image to Video שהופכת תמונה לסרטון וידאו (עברית):
https://youtu.be/mR3rN8vphC8
קליפ AI של שיר של הביטלס:
https://youtu.be/Z9MZdNrGbM4
כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):
https://youtu.be/F-gl4E5yo60
כך יוצרים לייב פורטרייט - דיוקן עם מחוות שלכם:
https://youtu.be/kM3KSrPrh9c
קליפ מתמונה בשיטה של Image to video:
https://youtu.be/yCczY9PNeao
קדימון AI מדומה לסרט מד"ב שאולי יצולם:
https://youtu.be/oAIrJP4n5sQ
כך מחליפים פנים לדמויות וידאו ב-Faceswap:
https://youtu.be/vVs0DZ8VyGQ
מינימקס המטורף בווידאו AI:
https://youtu.be/4QXCV_TYKZc?long=yes
הנה Dream Machine של לומה:
https://youtu.be/N_hlfwWtgPQ?long=yes
על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:
https://youtu.be/APJAQoSCwuA?long=yes
Magic Hour AI - כלי שיוצר סרטונים עד 60 שניות, שזה הכי הרבה:
https://youtu.be/eSpuvmRhcPg?long=yes
KREA - מודל ליצירת סרטונים AI:
https://youtu.be/OBewafac0Xs?long=yes
MINIMAX - עוד מודל וידאו מדהים מסין:
https://youtu.be/7JZLLxV1AGc?long=yes
כלי וידאו שמייצר ישר סרטון רב-סצנות:
https://youtu.be/BCCUNiToo94?long=yes
כלי הווידאו המומלצים לתחילת 2025:
https://youtu.be/K04zRJ8Vl_s?long=yes
וכך מייצרים סרטי וידאו ארוכים ב-Canva תחילת 2025:
https://youtu.be/tWmVbn4rUd0?long=yes
פרומפט

בינה מלאכותית גנרטיבית (Generative AI), בעברית "בינה מלאכותית יוצרת", היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.
התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד.
#הבינה היוצרת יודעת לעשות 3 דברים עיקריים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.
התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה (ראו בתגית "פרומפטים").
לפרומפטים הללו מתווספים לעתים ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר למתחילים. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח עם מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI ומבוצעות מיד.
ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.
בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה (בצירוף עובדים שלא יתעדכנו לחידושי ה-AI). לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.
אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".
הנה הסבר על הבינה הגנרטיבית:
https://youtu.be/rwF-X5STYks
הבינה היצירתית והתחומים שהיא עתידה לשבש:
https://youtu.be/vneJieU5qlg
היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):
https://youtu.be/05oOucZmO8Y
התפתחות התחום הגנרטיבי כפי שהוא מוצג באחת מאלפי חברות Generative AI (עברית):
https://youtu.be/joJVqKTPVsY
מהי בינה גנרטיבית?
https://youtu.be/pWNAtUwnBS8
משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:
https://youtu.be/3Jopz-V-IRQ
הנה הסבר מעמיק על הבינה המלאכותית היוצרת:
https://youtu.be/2IK3DFHRFfw?long=yes
אוסף חידושי וחדשות AI וידאו מדצמבר 2024:
https://youtu.be/30ZoRlr-TrY?long=yes
וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:
https://youtu.be/2IK3DFHRFfw?long=yes

כלי מחקר מבוססי בינה מלאכותית ג'נרטיבית הם סוג של סוכני AI משוכללים (AI agents) המיועדים לחקר וארגון המידע שאנו צוברים בתהליך המחקרי.
מבין מודלי השפה הגדולים (LLMs) בולטים קלוד ו-Chatgpt שפותחו לכלים מולטי-מודאליים. ככאלה הם מתאפיינים ביכולת ללמוד דברים מטקסטים, תמונות, צילומי מסך ועוד ולשפר את הביצועים עם תוצאות בפלט הכולל טקסטים, קוד, אודיו, וידאו, תמונות והבנה מרחבית.
לצידם יש מודל שפה שהוא יותר מחקרי באופיו וכולל מנוע חיפוש. מדובר ב-Perplexity, כלי שהחל בהתבססות על דאטה מחקרי, בעיקר מ-Google Research. כשהפך להיות הצ'טבוט המחפש הראשון, הוא מתבסס על תוכן עדכני ורלוונטי שהוא מאתר באינטרנט בזמן אמת, עם עדיפות לתמציתיות ולנתוני אמת. בנוסף, פרפלקסיטי שומר על כללי הציטוט המדעי, נותן ציטוטים עם ציוני מקור, מנמק ומקשר את טיעוניו למקורות שעליהם התבסס ומהם שאב את המובאות והתשובות.
יש גם את NotebookLM של גוגל, מעין מחברת חכמה בצירוף שותף ללמידה, שמבין אתכם ועוזר להפיק את המרב מהחומר המחקרי או הלימודי. במקום לבזבז זמן על עבודה טכנית ומשעממת, מעלים אליו עשרות חומרים, כולל טקסטים בהעתק-הדבק, מאמרים, לינקים, כתבות וספרים ועד סרטוני יוטיוב והקלטות קוליות. הכלי, שמתבסס על Gemini 2.0, קורא, מבין ומנתח את כל המידע במהירות ובמקום שתבזבזו שעות על קריאת חומר וכתיבת סיכומים, הוא מייצר לכם בקלות סיכומים חכמים, תובנות, מדריכי למידה, צירי זמן ותשובות לכל שאלה. ניתן לצ'טט או ממש לשוחח עם המחברת כאילו היא עוזר אישי וקולי, לשאול שאלות שתרצו על החומר ולקבל תשובות מדויקות ומובנות.
מרשימה גם היכולת של NotebookLM, להפוך את הידע שטענתם אליו לפודקאסט וגם לשאול שאלות עם מיקרופון ולהיות שותפים מלאים לשיחה עם "המגישים". תארו לעצמכם שתוכלו לקחת את הסיכום שיהפוך להרצאה מוקלטת בקול אנושי לחלוטין, או לסרטון לימודי או מקצועי. זו למידה חווייתית, שיתופית ומעניינת הרבה יותר.
עוד כלי מחקר טובים הם עזרי כתיבת פרומפטים ומאגרי פרומפטים המסייעים לתקשורת יעילה עם מודלים גדולים של שפה. כלים כאלה הם חיוניים למגוון עצום של שימושים, כולל שלל אפשרויות מחקר, כתיבה והפקת תובנות מתוכן גולמי וממקורות בינתיים.
ברמה המדעית יש גם יש כלי בינתי, מעין מודל שפה גדול (LLM) בשם Consensus שהוא בעצם מנוע חיפוש אקדמי מבוסס בינה מלאכותית. הוא עצמו משתמש במודלי שפה גדולים (LLMs) כדי לאסוף, לנתח ולהנגיש מידע מדעי בצורה פשוטה ומדויקת. המנוע של "קונצנזוס" מנתח יותר מ-200 מיליון מאמרים מדעיים, מסכם אותם באופן תמציתי ומציג את הקונצנזוס המדעי, מה הדעה הכללית ביחס לשאלות מדעיות בנושאים שונים. לשם כך הוא משתמש בכלים כמו "Consensus Meter", בו רואים את התפלגות הדעות בשאלה המסוימת ולומדים על "מה חושב המדע" לגביה.
עוד שיטה שהוא נוקט היא "Pro Analysis". שימושיה העיקריים בחינוך ובמחקר הם בסיוע לסטודנטים ולמורים במציאת מאמרים רלוונטיים, יצירת סיכומים מותאמים לשואל, ניתוחים מהירים של ספרות מדעית, סינון מאמרים שלא עומדים בדרישות מדעיות מוגדרות (כמו מתודולוגיה, גודל מדגם או מובהקות סטטיסטית) והפקה של ציטוטים אוטומטיים ודוחות מותאמים.
הנה NotebookLM, כלי המחקר לטעינת חומרים מגוונים ומשימות עליהם (עברית):
https://youtu.be/_vML22ACIRs
הוא יכול לייצר אפילו פודקסט:
https://youtu.be/1jgpsGDUXW4
הצ'טבוט שמצטיין במחקר ובחיפוש - Perplexity (עברית):
https://youtu.be/1MkBWfurQL4
כלי AI מקצועי למחקר מדעי בסקירת ספרות ולמידה ממאמרים:
https://youtu.be/LBzrVEG5qsk
מארינר - סוכן AI והעוזר הגלובלי של גוגל:
https://youtu.be/WJnUWldjJQA?long=yes
הבן של גוגל וקלוד - הנה פרפלקסיטי ששילב את שני העולמות (עברית):
https://youtu.be/33nBpKRWMms?long=yes
כמה כלי מחקר מבוססי AI:
https://youtu.be/Rc9R7T8S1c8?long=yes
ומדריך לעבודה עם NotebookLM:
https://youtu.be/UG0DP6nVnrc?long=yes
