מבוא לבינה מלאכותית 🧚

תיאוריה בסיסית וייצור של טקסט וקוד

מה זה בכלל בינה מלאכותית?

בינה מלאכותית היא היכולת לדמות את אופן המחשבה האנושי ולהציג יכולות שעד כה אפיינו את הבינה האנושית בלבד.

המונח נאמר לראשונה בשנת 1950 על ידי מדען המחשב ג׳ון מקארתי.

🤔 נסו לחשוב - אילו יכולות מאפיינות בינה אנושית?

למידת מכונה (Machine Learning)

כל מודלי הבינה המלאכותית שאנו מכירים היום מבוססים על למידת מכונה - תת-תחום במדעי המחשב שעוסק בפיתוח אלגוריתמים שמאפשרים למחשב ללמוד מתוך דוגמאות, במקום שנכתוב לו הוראות מדויקות לכל פעולה.

מה השתנה? תכנות קלאסי מול למידת מכונה

תכנות קלאסי (אלגוריתמים)

מבוסס על חוקים נוקשים.
אנחנו כותבים למחשב הוראות ספציפיות (למשל if/else).

קלט (Data) + חוקים (Rules) = תשובה (Output)

למידת מכונה (מודלים)

מבוסס על דוגמאות.
אנחנו נותנים למחשב המון נתונים, והוא מוצא את הדפוסים לבד.

קלט (Data) + תשובות (Answers) = חוקים (Model)

למה צריך את זה? דוגמת החתול 🐈

תארו לכם שאנחנו רוצים לכתוב תוכנית שמזהה אם בתמונה יש חתול.

☝️ הסוד הוא בדאטה: ללא למידת מכונה, אנחנו חייבים לתת הוראות מאוד ספציפיות. עם למידת מכונה, העבודה שלנו היא לאסוף ולסדר את הדוגמאות.

🧪 רוצים לנסות בעצמכם? ב-Teachable Machine אפשר לאמן מודל זיהוי תמונות פשוט ישירות בדפדפן.

דאטה-סט (Dataset)

דאטה-סט הוא מאגר המידע העצום שעליו המודל ״התאמן״. הוא יכול לכלול תמונות, טקסט, קוד, אודיו, וידאו - או כל שילוב שלהם.

איכות הדאטה-סט היא קריטית: אם המודל לומד על דוגמאות גרועות או חד-צדדיות, התוצאות שלו יהיו בהתאם.

☝️ כלל ברזל: הדאטה צריך להיות תואם לקלט ולפלט שהמודל צריך לקלוט ולפלוט. אם אנחנו בונים מודל שמייצר קוד מתמונה, אנחנו צריכים לאמן אותו על זוגות של תמונות-וקוד.

🔍 דוגמאות למאגרי דאטה-סטים:

מודל (Model)

מודל הוא ה״מוח״ המתמטי שלמד דפוסים מתוך הדאטה-סט. הוא לא ״מבין״ את העולם, אלא יודע לחזות מה התוצאה הסבירה ביותר בהינתן קלט מסוים.

בפועל, מודל הוא רשת של מיליארדי פרמטרים מתמטיים שהתכוונו בתהליך האימון. ככל שהמודל גדול יותר ואומן על יותר דאטה, בדרך כלל הוא חכם יותר - אבל גם יקר יותר להרצה.

🤔 אילו מודלים אתם כבר מכירים?

🔍 דוגמאות למאגרי מודלים:

מודליות - קלט ופלט(Modality)

מודליות היא סוג הקלט או הפלט שהמודל עובד איתו.

כל מודל בינה מלאכותית עובד באותו עיקרון בסיסי: מקבל קלט מסוג מסוים, מעבד אותו, ומחזיר פלט.

קלט (Input)
📝 טקסט
🖼️ תמונה
🎤 אודיו
🎥 וידאו
💻 קוד
🧠
מודל
פלט (Output)
📝 טקסט
🖼️ תמונה
🎵 אודיו
🎬 וידאו
💻 קוד

מודלים שונים תומכים בשילובים שונים. למשל, GPT-4o תומך בקלט של טקסט + תמונה ופלט של טקסט + תמונה + קוד. Midjourney תומך בקלט טקסט ופלט תמונה בלבד.

כשאנחנו אומרים שמודל הוא ״מולטי-מודלי״ (Multi-modal), הכוונה שהוא יודע לעבוד עם כמה סוגים של מידע בו-זמנית - למשל לקבל תמונה וטקסט ולפלוט וידאו או קוד.

סיכום: שלושת המושגים הבסיסיים

Dataset (דאטה-סט)

מאגר המידע העצום שעליו המודל ״התאמן״ - תמונות, טקסט, קוד.

Model (מודל)

ה״מוח״ המתמטי שלמד דפוסים מתוך הדאטה-סט ויודע לחזות את התוצאה הבאה.

Modality (מודליות)

סוג הקלט והפלט - טקסט לטקסט, טקסט לתמונה, תמונה לקוד...

☝️ מודל הוא כמו פונקציה: נותנים לו Input (פרומפט/קובץ) והוא מייצר Output מבוסס הסתברות.

איך בוחרים מודל / פלטפורמה?

מה חשוב לדעת על מודל?

לפני שמתחילים לעבוד עם מודל, כדאי להכיר כמה מושגים שישפיעו על הבחירה שלנו:

פרמטר מה זה אומר?
מודליות קלט/פלט מה אפשר להכניס למודל ומה הוא יודע להוציא?
יכולות מה המודל יודע לעשות? (ניתוח תמונות, קוד מורכב, עברית)
דאטהסט שעליו המודל אומן (Training Data) על מה המודל אומן? האם הוא מכיר את התחום שלנו? מתי הוא יצא?
רישיון וזכויות (License) למי שייך הפלט? האם מותר להשתמש בו לצרכים מסחריים?
מחיר חינם? מנוי חודשי? תשלום לפי שימוש (API)?
חווית משתמש (UX) האם הממשק נוח? יש Canvas? יש שיתוף פעולה?

💡 טיפ: אין מודל אחד ש״הכי טוב״ לכל דבר. כדאי להכיר כמה כלים ולבחור לפי המשימה.

מודלים לפי קלט ופלט

כשאנחנו בוחרים מודל, כדאי שנבין מה אנחנו נותנים לו ומה אנחנו רוצים לקבל בחזרה.

טקסט ← טקסט

צ׳אט רגיל, כתיבת מיילים, סיכום טקסט, תרגום.

קוד זה גם סוג של טקסט!

טקסט ← תמונה

Midjourney, DALL-E, Imagen - יצירת ויזואליה מטקסט.

תמונה ← טקסט

תיאור תמונות, זיהוי תווים (OCR), ניתוח ויזואלי.

טקסט ← אודיו

המרת טקסט לדיבור, יצירת מוזיקה, אפקטים קוליים.

טקסט ← וידאו

יצירת סרטוני וידאו מתיאור טקסטואלי.

תמונה ← וידאו

יצירת סרטוני וידאו מתמונה.

הפרומפט (Prompt)

פרומפט הוא הטקסט שנכנס כקלט למודל. זו הדרך שלנו לתקשר עם הבינה המלאכותית - לתאר מה אנחנו רוצים, לתת הקשר, ולהגדיר את הפורמט של התוצאה.

ככל שהפרומפט שלנו ברור ומדויק יותר, כך התוצאה תהיה טובה יותר.

שיטות שונות לכתוב פרומפטים

תפקיד + משימה + פורמט (Role + Task + Format)

שיטה מוכחת לבניית פרומפט טוב - לתת למודל שלושה מרכיבים:

🎭 תפקיד (Role)

מי אתה? תנו למודל פרסונה.

📋 משימה (Task)

מה צריך לעשות?

📐 פורמט (Format)

איך צריכה להיראות התוצאה?

💡 דוגמה: ״אתה סופר במאה ה-19, עלייך לכתוב ברכת יום הולדת לאמא, תכתוב ברכה באורך 100 מילים בחרוזים.״

קונטקסט (Context)

מה המידע שאנחנו נותנים למודל כחלק מהפרומפט.
ככל שניתן יותר הקשר רלוונטי, התוצאה תהיה מדויקת יותר.

☝️ למודלים יש מגבלה על אורך הפרומפט (Context Window), אז חשוב להיות ממוקדים.

שפה (Language)

אפשר לכתוב גם עברית וגם אנגלית. השפה היא שפה טבעית, אך צריך להיות ברורים ומפורשים.

דרכים לכתיבת קוד עם בינה מלאכותית

אנחנו עוברים מעידן שבו צריך לדעת ״תחביר״ (איפה שמים נקודה-פסיק) לעידן שבו צריך לדעת לתאר מה רוצים ולנהל שיחה עם ה-AI.

זה לא אומר שלא צריך להבין קוד או לא לדעת מה אנחנו רוצות ליצור - זה אומר שהתפקיד שלנו משתנה למנחים של הבינה המלאכותית.

יש כמה דרכים לעבוד:

1. צ׳אט ו-Copy-Paste

הדרך הפשוטה: פותחים צ׳אט, מבקשים קוד, מעתיקים אותו לקובץ HTML או ל-p5.js Editor.
זה עובד מצוין בהתחלה ומאפשר ללמוד איך לנסח בקשות (Prompting).

✏️ נסו עכשיו: פתחו אחד מהכלים למעלה ובקשו ממנו: ״צור לי דף HTML שאומר Hello World עם עיצוב צבעוני ומגניב.״
העתיקו את הקוד לקובץ HTML ופתחו בדפדפן.

2. סביבות עבודה מתקדמות

בשיטה הזו ה-AI לא רק כותב קוד - הוא גם מריץ אותו בשבילנו בחלון צדדי. אפשר לראות את התוצאה בלייב ולהמשיך לשפר דרך השיחה.

✏️ נסו עכשיו: פתחו Gemini Canvas ובקשו: ״בנה לי כרטיס ביקור דיגיטלי עם השם שלי ו-QR Code.״
שנו את העיצוב דרך השיחה עד שמתאים לכם.

3. בינה מלאכותית בתוך העורך

ה-AI הופך לשותף לכתיבה בתוך עורך הקוד שלנו. הוא מכיר את כל הפרויקט, יודע להשלים שורות, להציע תיקונים, ואפילו לכתוב קבצים שלמים.

הכלים האלה שונים מצ׳אט רגיל כי הם מכירים את כל הקבצים בפרויקט ויכולים לערוך ישירות, לא רק להציע.

איך לעבוד נכון עם בינה מלאכותית?

✏️ תרגילים

7 תרגילים - מהקל לקשה:

1. Hello World ב-Canvas

צרו מסך שאומר Hello World ב-Gemini Canvas.
עכשיו שנו את ה״ווייב״: בקשו ממנו להפוך את זה לסגנון Brutalist, או למסך של משחק רטרו משנות ה-80.
הוסיפו את השם שלכם באנימציה.

2. כרטיס ביקור דיגיטלי

בנו דף HTML/CSS שכולל את השם שלכם, קישורים לרשתות, ו-QR Code שנוצר בעזרת AI.
נסו ב-Canvas או העתיקו קוד מצ׳אט לקובץ מקומי.

3. משרבוט לקוד (Sketch ← HTML)

ציירו סקיצה ידנית של מבנה אתר (Header, Main, Footer) על דף נייר.
צלמו אותה ובקשו מה-AI להפוך אותה לשלד HTML תקין.
נסו ב-Claude או Gemini.

4. קוד מבוסס דימוי (Image ← Code)

קחו עבודה (תמונה / איור / עיצוב) שיצרתם בסמסטר א׳.
העלו אותה ל-AI ובקשו לייצר גרסה אינטראקטיבית ב-p5.js שמגיבה לעכבר בהשראת אותה עבודה.

5. עריכת CSS עם AI

קחו את קובצי ה-CSS של האתר שבניתם בשיעורים הקודמים.
העלו ל-AI ובקשו: אנימציות Hover מורכבות, Dark Mode יוקרתי, או פלטת צבעים חדשה לגמרי.

6. אפליקציית Multi-Input / Output

בנו אפליקציה קטנה שחוקרת סוגי קלט שונים: עכבר, מקלדת, מיקרופון, מצלמה -
ופלטים שונים: שינויי מסך, צבעים, צורות, אודיו.

🔥 7. אתגר: אפליקציה עם מודל AI בפנים

בנו אפליקציה שמשתמשת במודל AI בתוכה - למשל:

אפשר להשתמש ב-Gemini API (חינמי ל-AI Studio) או כל API אחר.

קישורים וכלים

כלי AI מומלצים:


בפרקים הקודמים: