מבוא לבינה מלאכותית

מה זה בכלל בינה מלאכותית?

בינה מלאכותית היא היכולת לדמות את אופן המחשבה האנושי ולהציג יכולות שעד כה אפיינו את הבינה האנושית בלבד.

המונח נאמר לראשונה בשנת 1950 על ידי מדען המחשב ג׳ון מקארתי.

🤔 נסו לחשוב - אילו יכולות מאפיינות בינה אנושית?

למידת מכונה (Machine Learning)

כל מודלי הבינה המלאכותית שאנו מכירים היום מבוססים על למידת מכונה - תת-תחום במדעי המחשב שעוסק בפיתוח אלגוריתמים שמאפשרים למחשב ללמוד מתוך דוגמאות, במקום שנכתוב לו הוראות מדויקות לכל פעולה.

מה השתנה? תכנות קלאסי מול למידת מכונה

תכנות קלאסי (אלגוריתמים)

מבוסס על חוקים נוקשים.
אנחנו כותבים למחשב הוראות ספציפיות (למשל if/else).

קלט (Data) + חוקים (Rules) = תשובה (Output)

למידת מכונה (מודלים)

מבוסס על דוגמאות.
אנחנו נותנים למחשב המון נתונים, והוא מוצא את הדפוסים לבד.

קלט (Data) + תשובות (Answers) = חוקים (Model)

למה צריך את זה? דוגמת החתול 🐈

תארו לכם שאנחנו רוצים לכתוב תוכנית שמזהה אם בתמונה יש חתול.

בתכנות קלאסי: נצטרך להגדיר חוקים - חיה, 4 רגליים, 2 אוזניים, יש פרווה... אבל מה קורה אם החתול בתמונה מוסתר חלקית? או שזה כלב שעונה על אותם חוקים?
בלמידת מכונה: לא נכתוב חוקים בכלל. פשוט נראה למחשב מיליוני תמונות ונגיד לו: ״זה חתול״ ו-״זה לא חתול״. המודל ילמד סטטיסטית את המאפיינים, וכשנשאל אותו על תמונה חדשה - הוא ידע לענות בהסתברות.

☝️ הסוד הוא בדאטה: ללא למידת מכונה, אנחנו חייבים לתת הוראות מאוד ספציפיות. עם למידת מכונה, העבודה שלנו היא לאסוף ולסדר את הדוגמאות.

🧪 רוצים לנסות בעצמכם? ב-Teachable Machine אפשר לאמן מודל זיהוי תמונות פשוט ישירות בדפדפן.

דאטה-סט (Dataset)

דאטה-סט הוא מאגר המידע העצום שעליו המודל ״התאמן״. הוא יכול לכלול תמונות, טקסט, קוד, אודיו, וידאו - או כל שילוב שלהם.

איכות הדאטה-סט היא קריטית: אם המודל לומד על דוגמאות גרועות או חד-צדדיות, התוצאות שלו יהיו בהתאם.

☝️ כלל ברזל: הדאטה צריך להיות תואם לקלט ולפלט שהמודל צריך לקלוט ולפלוט. אם אנחנו בונים מודל שמייצר קוד מתמונה, אנחנו צריכים לאמן אותו על זוגות של תמונות-וקוד.

🔍 דוגמאות למאגרי דאטה-סטים:

Hugging Face Datasets - מאגר ענק של דאטה-סטים פתוחים לכל סוגי המשימות.
Kaggle Datasets - פלטפורמה עם אלפי דאטה-סטים, תחרויות ומחברות קוד.

מודל (Model)

מודל הוא ה״מוח״ המתמטי שלמד דפוסים מתוך הדאטה-סט. הוא לא ״מבין״ את העולם, אלא יודע לחזות מה התוצאה הסבירה ביותר בהינתן קלט מסוים.

בפועל, מודל הוא רשת של מיליארדי פרמטרים מתמטיים שהתכוונו בתהליך האימון. ככל שהמודל גדול יותר ואומן על יותר דאטה, בדרך כלל הוא חכם יותר - אבל גם יקר יותר להרצה.

🤔 אילו מודלים אתם כבר מכירים?

🔍 דוגמאות למאגרי מודלים:

Hugging Face Models - מאגר ענק של מודלים פתוחים למגוון משימות.
Claude Models (Anthropic) - סקירת המודלים של Anthropic ויכולותיהם.
OpenAI Models - תיעוד המודלים של OpenAI (GPT, DALL-E ועוד).

מודליות - קלט ופלט(Modality)

מודליות היא סוג הקלט או הפלט שהמודל עובד איתו.

כל מודל בינה מלאכותית עובד באותו עיקרון בסיסי: מקבל קלט מסוג מסוים, מעבד אותו, ומחזיר פלט.

קלט (Input)

📝 טקסט

🖼️ תמונה

🎤 אודיו

🎥 וידאו

💻 קוד

←

🧠
מודל

←

פלט (Output)

📝 טקסט

🖼️ תמונה

🎵 אודיו

🎬 וידאו

💻 קוד

מודלים שונים תומכים בשילובים שונים. למשל, GPT-4o תומך בקלט של טקסט + תמונה ופלט של טקסט + תמונה + קוד. Midjourney תומך בקלט טקסט ופלט תמונה בלבד.

כשאנחנו אומרים שמודל הוא ״מולטי-מודלי״ (Multi-modal), הכוונה שהוא יודע לעבוד עם כמה סוגים של מידע בו-זמנית - למשל לקבל תמונה וטקסט ולפלוט וידאו או קוד.

טקסט ← טקסט (צ׳אט, סיכום, תרגום)
טקסט ← תמונה (Midjourney, DALL-E, Imagen)
תמונה ← טקסט (תיאור תמונות, OCR)
תמונה ← קוד (סקיצה ← אתר)
טקסט ← קוד (תיאור ← p5.js)
טקסט ← אודיו (דיבור, מוזיקה)
טקסט ← וידאו (Sora, Veo)

סיכום: שלושת המושגים הבסיסיים

Dataset (דאטה-סט)

מאגר המידע העצום שעליו המודל ״התאמן״ - תמונות, טקסט, קוד.

Model (מודל)

ה״מוח״ המתמטי שלמד דפוסים מתוך הדאטה-סט ויודע לחזות את התוצאה הבאה.

Modality (מודליות)

סוג הקלט והפלט - טקסט לטקסט, טקסט לתמונה, תמונה לקוד...

☝️ מודל הוא כמו פונקציה: נותנים לו Input (פרומפט/קובץ) והוא מייצר Output מבוסס הסתברות.

איך בוחרים מודל / פלטפורמה?

מה חשוב לדעת על מודל?

לפני שמתחילים לעבוד עם מודל, כדאי להכיר כמה מושגים שישפיעו על הבחירה שלנו:

פרמטר	מה זה אומר?
מודליות קלט/פלט	מה אפשר להכניס למודל ומה הוא יודע להוציא?
יכולות	מה המודל יודע לעשות? (ניתוח תמונות, קוד מורכב, עברית)
דאטהסט שעליו המודל אומן (Training Data)	על מה המודל אומן? האם הוא מכיר את התחום שלנו? מתי הוא יצא?
רישיון וזכויות (License)	למי שייך הפלט? האם מותר להשתמש בו לצרכים מסחריים?
מחיר	חינם? מנוי חודשי? תשלום לפי שימוש (API)?
חווית משתמש (UX)	האם הממשק נוח? יש Canvas? יש שיתוף פעולה?

💡 טיפ: אין מודל אחד ש״הכי טוב״ לכל דבר. כדאי להכיר כמה כלים ולבחור לפי המשימה.

מודלים לפי קלט ופלט

כשאנחנו בוחרים מודל, כדאי שנבין מה אנחנו נותנים לו ומה אנחנו רוצים לקבל בחזרה.

טקסט ← טקסט

צ׳אט רגיל, כתיבת מיילים, סיכום טקסט, תרגום.

קוד זה גם סוג של טקסט!

טקסט ← תמונה

Midjourney, DALL-E, Imagen - יצירת ויזואליה מטקסט.

תמונה ← טקסט

תיאור תמונות, זיהוי תווים (OCR), ניתוח ויזואלי.

טקסט ← אודיו

המרת טקסט לדיבור, יצירת מוזיקה, אפקטים קוליים.

טקסט ← וידאו

יצירת סרטוני וידאו מתיאור טקסטואלי.

תמונה ← וידאו

יצירת סרטוני וידאו מתמונה.

שיטות שונות לכתוב פרומפטים

תפקיד + משימה + פורמט (Role + Task + Format)

שיטה מוכחת לבניית פרומפט טוב - לתת למודל שלושה מרכיבים:

🎭 תפקיד (Role)

מי אתה? תנו למודל פרסונה.

📋 משימה (Task)

מה צריך לעשות?

📐 פורמט (Format)

איך צריכה להיראות התוצאה?

💡 דוגמה: ״אתה סופר במאה ה-19, עלייך לכתוב ברכת יום הולדת לאמא, תכתוב ברכה באורך 100 מילים בחרוזים.״

קונטקסט (Context)

מה המידע שאנחנו נותנים למודל כחלק מהפרומפט.
ככל שניתן יותר הקשר רלוונטי, התוצאה תהיה מדויקת יותר.

☝️ למודלים יש מגבלה על אורך הפרומפט (Context Window), אז חשוב להיות ממוקדים.

שפה (Language)

אפשר לכתוב גם עברית וגם אנגלית. השפה היא שפה טבעית, אך צריך להיות ברורים ומפורשים.

דרכים לכתיבת קוד עם בינה מלאכותית

אנחנו עוברים מעידן שבו צריך לדעת ״תחביר״ (איפה שמים נקודה-פסיק) לעידן שבו צריך לדעת לתאר מה רוצים ולנהל שיחה עם ה-AI.

זה לא אומר שלא צריך להבין קוד או לא לדעת מה אנחנו רוצות ליצור - זה אומר שהתפקיד שלנו משתנה למנחים של הבינה המלאכותית.

יש כמה דרכים לעבוד:

1. צ׳אט ו-Copy-Paste - הדרך הפשוטה ביותר
2. סביבות עבודה מתקדמות - Canvas, Artifacts, AI Studio
3. AI בתוך ה-Editor - Copilot, Cursor, Antigravity

1. צ׳אט ו-Copy-Paste

הדרך הפשוטה: פותחים צ׳אט, מבקשים קוד, מעתיקים אותו לקובץ HTML או ל-p5.js Editor.
זה עובד מצוין בהתחלה ומאפשר ללמוד איך לנסח בקשות (Prompting).

Gemini ChatGPT Claude Grok

✏️ נסו עכשיו: פתחו אחד מהכלים למעלה ובקשו ממנו: ״צור לי דף HTML שאומר Hello World עם עיצוב צבעוני ומגניב.״
העתיקו את הקוד לקובץ HTML ופתחו בדפדפן.

2. סביבות עבודה מתקדמות

בשיטה הזו ה-AI לא רק כותב קוד - הוא גם מריץ אותו בשבילנו בחלון צדדי. אפשר לראות את התוצאה בלייב ולהמשיך לשפר דרך השיחה.

Gemini Canvas: מאפשר לראות את הקוד רץ בלייב לצד הצ׳אט.
פתחו Gemini ←
Claude Artifacts: מאפשר תצוגה חיה של HTML/CSS/React ליד הצ׳אט.
פתחו Claude ←
AI Studio: סביבת הניסויים למפתחים של גוגל. מאפשרת לשלוט בפרמטרים של המודל (Temperature, System Instructions) ולבנות אפליקציות מורכבות.
פתחו AI Studio ←

✏️ נסו עכשיו: פתחו Gemini Canvas ובקשו: ״בנה לי כרטיס ביקור דיגיטלי עם השם שלי ו-QR Code.״
שנו את העיצוב דרך השיחה עד שמתאים לכם.

3. בינה מלאכותית בתוך העורך

ה-AI הופך לשותף לכתיבה בתוך עורך הקוד שלנו. הוא מכיר את כל הפרויקט, יודע להשלים שורות, להציע תיקונים, ואפילו לכתוב קבצים שלמים.

GitHub Copilot - תוסף ל-VS Code. השלמות אוטומטיות ושיחה עם ה-AI על הקוד.
Claude Code - כלי AI לקידוד שרץ בטרמינל. מבין את כל הפרויקט, כותב ועורך קבצים, ומריץ פקודות באופן עצמאי.
Cursor - עורך קוד שנבנה סביב AI (מבוסס על VS Code). מאפשר לבחור קטע קוד ולבקש שינויים, וגם לכתוב פרויקטים שלמים.
Antigravity - עוזר AI שיכול לקרוא את כל הפרויקט, להריץ פקודות, לגלוש באינטרנט, ולבנות פיצ׳רים שלמים באופן עצמאי.

הכלים האלה שונים מצ׳אט רגיל כי הם מכירים את כל הקבצים בפרויקט ויכולים לערוך ישירות, לא רק להציע.

איך לעבוד נכון עם בינה מלאכותית?

עבדו בשלבים: אל תבקשו את כל האתר בבת אחת. קודם שלד, אז צבעים, אז אינטראקציה.
תנו הקשר (Context): אנחנו בונים אתר שהמטרה שלו היא.. המשתמשים הם.. הסגנון הוא.. האינטראציה היא..
תשאלו למה: אם ה-AI נותן לכם קוד, בקשו ממנו להסביר שורה-שורה. זו הדרך הכי טובה ללמוד.
אל תפחדו מטעויות: ה-AI טועה הרבה. אם הקוד לא עובד, העתיקו את השגיאה בחזרה לצ׳אט ובקשו ממנו לתקן.
כמה שיותר פירוט: תתארו אסתטיקה, תחושה, רפנרסים ויזואליים, פלטת צבעים, כמה שיותר שליטה אצלכם ולא אצל המודל
לפעמים עדיף להתחיל מחדש כשהשיחה נהיית ארוכה מידי, או כשמרגישים שיש איזו שגיאה שלא מצליחים לתקן, אפשר לנסות להתחיל שיחה חדשה עם הקוד שכבר ייצרנו (או לבנות מההתחלה)

✏️ תרגילים

7 תרגילים - מהקל לקשה:

1. Hello World ב-Canvas

צרו מסך שאומר Hello World ב-Gemini Canvas.
עכשיו שנו את ה״ווייב״: בקשו ממנו להפוך את זה לסגנון Brutalist, או למסך של משחק רטרו משנות ה-80.
הוסיפו את השם שלכם באנימציה.

2. כרטיס ביקור דיגיטלי

בנו דף HTML/CSS שכולל את השם שלכם, קישורים לרשתות, ו-QR Code שנוצר בעזרת AI.
נסו ב-Canvas או העתיקו קוד מצ׳אט לקובץ מקומי.

3. משרבוט לקוד (Sketch ← HTML)

ציירו סקיצה ידנית של מבנה אתר (Header, Main, Footer) על דף נייר.
צלמו אותה ובקשו מה-AI להפוך אותה לשלד HTML תקין.
נסו ב-Claude או Gemini.

4. קוד מבוסס דימוי (Image ← Code)

קחו עבודה (תמונה / איור / עיצוב) שיצרתם בסמסטר א׳.
העלו אותה ל-AI ובקשו לייצר גרסה אינטראקטיבית ב-p5.js שמגיבה לעכבר בהשראת אותה עבודה.

5. עריכת CSS עם AI

קחו את קובצי ה-CSS של האתר שבניתם בשיעורים הקודמים.
העלו ל-AI ובקשו: אנימציות Hover מורכבות, Dark Mode יוקרתי, או פלטת צבעים חדשה לגמרי.

6. אפליקציית Multi-Input / Output

בנו אפליקציה קטנה שחוקרת סוגי קלט שונים: עכבר, מקלדת, מיקרופון, מצלמה -
ופלטים שונים: שינויי מסך, צבעים, צורות, אודיו.

🔥 7. אתגר: אפליקציה עם מודל AI בפנים

בנו אפליקציה שמשתמשת במודל AI בתוכה - למשל:

מחולל שירים / פואמות
ממשק צ׳אט אינטראקטיבי
אפליקציה שמייצרת תמונות בתוך הממשק

אפשר להשתמש ב-Gemini API (חינמי ל-AI Studio) או כל API אחר.

קישורים וכלים

כלי AI מומלצים:

Gemini - הצ׳אט של גוגל, כולל Canvas לקוד
ChatGPT - הצ׳אט של OpenAI
Claude - של Anthropic, מצוין לקוד (Artifacts)
Grok - של xAI
AI Studio - סביבת פיתוח מתקדמת של גוגל
Cursor - עורך קוד מבוסס AI

בפרקים הקודמים:

מבוא לבינה מלאכותית 🧚