ערך: אריה עמית
יועץ אסטרטגי וחבר נשיאות הלשכה
מכיוון שמנהלי מערכות מידע ומנהיגים טכנולוגיים אחרים עומדים בפני לחץ לאמץ AI , ארגונים רבים עדיין מדלגים על הצעד הראשון הקריטי להטמעה מוצלחת: סדר בבסיס הנתונים שלהם.
למרות ההמלצות כבר מלפני שש שנים שחזרו לפחות , מנהלי מערכות מידע רבים לא מצליחים לאסוף ולארגן את הכמות העצומה של הנתונים שהארגונים שלהם מייצרים ללא הרף, על פי דברי כמה מספקי ניהול נתונים. לפחות ממחצית מהארגונים יש תהליך ניהול נתונים קוהרנטי לפני שהם משיקים פרויקטים של AI. רק לכ-20% מהארגונים יש אסטרטגיות נתונים בוגרות מספיק כדי לנצל את מלוא היתרונות של רוב כלי הבינה המלאכותית, כמה פרויקטים קטנים של בינה מלאכותית יכולים לעבוד על בסיס כמות מוגבלת של נתוני חברה, או נתונים מחוץ לחברה, אבל הטמעות AI מוצלחות רבות דורשות נתונים פנימיים מקיפים.
רוב ממה שנעשה היום כשמדברים עם לקוחות על GEN AI הוא למעשה הגדרה ברמה של מה שאפשר, ואם לא יהיו נתונים מסודרים, לא תהיה להם ההשפעה המבוקשת.
הלחץ לשגר
בינתיים, לפחות ממחצית מהארגונים יש אסטרטגיות נתונים כדי לתמוך בכל סוג של פריסות בינה מלאכותית. לארגונים מסוימים יש מושג קטן בניהול נתונים, אך עדיין משיקים פרויקטים של AI. יש לחץ רב ממשקיעים ומהשוק, להיכנס לבינה מלאכותית, מתחילים עם משהו, ואחרי שניסו כמה חודשים הם מבינים שזה לא נתן את התוצאות הרצויות.
אם תשתית IT וכוח מחשוב מהווים את המנוע של AI , הנתונים הם הדלק, יישומי AI המתוחכמים ביותר מסתמכים על נתונים איכותיים כדי לתפקד, הוא אומר. הנתונים הם המבדיל: נתונים גרועים שווים AI גרוע.
סקר שנערך לאחרונה ע"י חברת גרטנר מלמד ש 61 אחוזים ממנהלי הנתונים והאנליסטים הראשיים שנסקרו הסכימו ש-ChatGPT ושיבושים אחרים בשוק הטכנולוגיה אילצו אותם להתפתח או לחשוב מחדש על אסטרטגיות הנתונים והניתוח שלהם. עם זאת, 78% מה-CDAO אמרו שאסטרטגיות הנתונים והניתוח שלהם התפתחו מספיק במהלך 2023 כדי לתמוך בחדשנות.
בעיות נתונים נפוצות
אתגרי ניהול הנתונים מגיעים מארבעה כיוונים:
ראשית, נתונים קיימים ב Silos. הנתונים של צוות השיווק עשויים להימצא במיקום אחר, עם כללי גישה שונים, מאשר הנתונים של צוות ההנדסה.
שנית, רוב הארגונים יצרו כמות גדולה של נתונים, והם יוצרים יותר מדי יום. ללא תוכנית ומערכת לניהול נתונים, הנתונים הישנים קבורים בתיקיות בפינה חשוכה של שרת ישן, והנתונים החדשים אינם מקוטלגים ומאורגנים.
הנתונים אינם שלמים, לא מדויקים ולא עקביים.
לבסוף, אחוז גדול מהנתונים אינו מובנה ולכן אינו קל לארגון. נתונים חיוניים נמצאים במאות מיילים שנשלחים ומתקבלים מדי יום, בגיליונות אלקטרוניים, במצגות PowerPoint , בסרטונים, בתמונות, בדוחות עם גרפים, במסמכי טקסט, בדפי אינטרנט, בהזמנות רכש, בחשבונות שירות ובקובצי PDF/ מסמכי טקסט, המאוחסנים לעתים קרובות במספר מיקומים בארגון, מכילים לעתים קרובות שפע של מידע . פריט מידע חשוב יכול ל"היקבר" בתרשים בעמוד 5 של מסמך בן 20 עמודים, או לאורך דוח אנליסט בן 100 עמודים בוול סטריט. הרבה נתונים שמיוצרים על ידי האפליקציה הרגילה או המשתמשים העסקיים נשארים במסמכים, ומסמכים הם עדיין צורת התקשורת הגדולה ביותר, הנתונים האלה זורמים חופשית ואינם נמצאים במקום אחד וזה מהווה אתגר והזדמנות ענקיים.
יותר נתונים לא תמיד מייצרים AI טוב יותר
תפיסה שגויה אחת לגבי נפח הנתונים שחברות מחזיקות היא שבהזנת מודלים של AI יותר נתונים יוצרים תוצאות AI טובות יותר,.בעוד שחלק מכלי בינה מלאכותית דורשים כמויות גדולות של נתונים, האיכות חשובה יותר.הנתונים שלא נאספו יהיו הבסיס לתוצאות השגויות, איכות הנתונים קובעת הכל.
אבל משתמשי בינה מלאכותית לא צריכים להפחית מהביקוש לנתונים מ-AI של מודלים LLM, AI מאד רעב לנתונים, והנתונים צריכים להיות מדויקים, הם צריכים להיות בזמן, הם צריכים להיות מהירים וצריכים להיות הרבה מהם.
מעבר לארבעת הכיוונים העיקריים של בעיות ניהול נתונים, ארגונים נאבקים גם עם מקור יחיד של אמת בנתונים שלהם. איזו מחמש הגרסאות של PDF של מפרט מוצר שקיים בארגון היא הנכונה? האם לצ'אטבוט תמיכת הלקוחות יש גישה לכל חמש הגרסאות?
דגש על איכות וסטנדרטיזציה
עבור אותם ארגונים הנאבקים לטייב את הנתונים שלהם, מומלץ להתמקד בתהליכי ניהול נתונים וממשל שמתחשבים בפרטיות, סטנדרטיזציה, איכות ואינטגרציה. עוד לפני שארגונים מתחילים לטייב ולארגן את הנתונים שלהם, מומלץ להם לחשוב על המטרות שלהם עבור הנתונים.
לעתים קרובות מתעלמים מטיוב הנתונים בפרויקטים של בינה מלאכותית מכיוון שזה לא אטרקטיבי, אבל חלק עצום מפרויקט AI 80% או יותר, הוא טיוב הנתונים.
זה סוג של עבודת רוטינית, רוב הזמן בפרויקטים האלה מוקדש לוודא שיש לנו את נתוני ההדרכה הנכונים כדי להזין את המודלים האלה של למידת מכונה שיודעים לזהות דפוסים שקיימים בתוך הנתונים.
משתמשי AI חייבים גם להכיר בכך שניקוי הנתונים אינו פרויקט חד פעמי, אם ארגנת את הנתונים הפנימיים שלך לפני שלוש שנים, אתה לא מעודכן. ונתונים לא מגיעים רק ממשתמשים פנימיים; רוב הארגונים מקבלים כל הזמן נתונים משותפים, ספקים ומקורות אחרים. זה מסע, תמיד יהיו מקורות נתונים נוספים שיכולים לספק תובנות, ותמיד נרצה לפקח על תקינותו של צינור הנתונים הזה.
צעדים קטנים
מומלץ לארגונים להתחיל בקטן בעת הפעלת פרויקטי בינה מלאכותית, אולי להתמקד במקרה של שימוש בבינה מלאכותית אחת ביחידה עסקית אחת. ארגון הנתונים המוחזקים על ידי יחידה עסקית אחת קל יותר מאשר חיבור טרה-בייט של נתונים מכל הארגון.
מצאו סוג מסוים של נתונים, וטייבו את הנתונים באיטרציה אחת. הסתכלו על תת-קבוצה אחת של הנתונים שנאספו ואז החלו את מאמצי הבינה המלאכותית עליהם.Top of Form חלקי הארגון.
Hozzászólások