ערך: אריה עמית מקור: McKinsey Digital
24.9.2024
ההייפ סביב בינה מלאכותית (Gen AI) והערך הפוטנציאלי העצום שלה הניעו ארגונים לחשוב מחדש על הגישות שלהם לעסקים עצמם. ארגונים מחפשים לנצל מגוון הזדמנויות, החל מיצירת תרופות חדשות ועד לאפשר לסוכנים חכמים המנהלים תהליכים שלמים ועד להגדלת הפרודוקטיביות של כל העובדים. שורה של סיכונים ושיקולים חדשים, כמובן, הולכים יד ביד עם ההתפתחויות הללו. במרכז הכל נתונים. ללא גישה לנתונים טובים ורלוונטיים, עולם האפשרויות והערך החדש הזה יישאר מחוץ להישג יד.
המאמר נועד לעזור למנהלים לחשוב על סדרי עדיפויות חיוניים המשקפים את השינויים החשובים ביותר שמתרחשים, מהן המורכבויות העיקריות, והיכן מנהלים יכולים למקד את האנרגיה שלהם לממש את הארגון מונע הנתונים עד 2030.
כל הנתונים, בכל מקום, בבת אחת
עד 2030, חברות רבות יתקרבו ל"נתונים בכל מקום". לא רק שלעובדים יהיו הנתונים העדכניים ביותר בהישג ידם, אלא שהנתונים יהיו מוטמעים גם במערכות, תהליכים, ערוצים, אינטראקציות ונקודות החלטה שמניעות פעולות אוטומטיות (עם פיקוח אנושי מספק).
טכנולוגיות חדשניות, ייצרו נתונים מדויקים יותר בזמן אמת על הביצועים של מוצרים ממכוניות ועד מכשירים רפואיים, אותם יכולות AI יישומי יוכלו לנתח כדי להמליץ ולבצע עדכוני תוכנה ממוקדים. סוכני בינה מלאכותית המבוססים על נתוני לקוחות היסטוריים מפורטים יקיימו אינטראקציה עם תאומים דיגיטליים של אותם לקוחות כדי לבדוק מוצרים, שירותים והצעות מותאמים אישית לפני שהם יושקו לעולם האמיתי. מודלים של LLMs העובדים יחד ינתחו נתוני בריאות אינדיבידואליים כדי להפיק, לפתח ולפרוס תרופות מותאמות אישית.
חלק מהחברות כבר מאמצות את החזון הזה, אבל בארגונים רבים, מעטים האנשים שמבינים אילו נתונים הם באמת צריכים כדי לקבל החלטות טובות יותר או להבין את היכולות של הנתונים כדי לאפשר תוצאות טובות יותר.
הפעלת התחזיות אלו על בסיס טכנולוגיות מתקדמות מחייבת את מנהלי הנתונים - CDOs להפעיל את הארגון כך שיחשוב ויפעל "נתונים ובינה מלאכותית תחילה" בעת קבלת כל החלטה. זה אומר להפוך את הנתונים לקלים לשימוש על ידי יצירת תקנים וכלים למשתמשים ולמערכות כדי לגשת בקלות לנתונים הנכונים, קל למעקב על ידי מתן שקיפות למודלים כדי שמשתמשים יוכלו לבדוק תשובות ותוצאות אוטומטיות, וקל לסמוך עליהם על ידי הגנה על נתונים באמצעי סייבר מתקדמים ובדיקות מתמשכות כדי לשמור על דיוק גבוה.
מנהלי נתונים יצטרכו לאמץ חשיבה של "הכל, בכל מקום, בבת אחת" כדי להבטיח שניתן לשתף ולהשתמש בנתונים ברחבי הארגון כראוי. זה כולל, למשל, הגדרה ברורה ותקשורת של מבני נתונים כלומר, היררכיות נתונים ושדות, כך שהצוותים יבינו את הסטנדרטים הדרושים למערך נתונים נתון וקביעת כללים עסקיים ברורים , כגון מתן שמות למוסכמות או סוגי נתונים שמקובלים בארגון.
השגת בידול ויתרון תחרותי
שני מאפיינים מרכזיים של טכנולוגיות עדכניות כמוAI , Low code/No code ומודלים של SLM הם קלות השימוש בהם ומהירות התפשטותם. ספקים, למשל, משלבים את ה-Gen AI בהיצע שלהם; סטארט-אפים מוציאים במהירות כלים ודגמים חדשים; ועובדים רבים משתמשים ב-Gen AI לעזרה בעבודתם. 65% מהמשיבים לסקר שנערך לאחרונה על ידי מקינזי אומרים שהארגונים שלהם משתמשים בקביעות ב-Gen AI לפחות בפונקציה עסקית אחת, לעומת שליש בשנה שעברה.
הבעיה עם האימוץ ההמוני הזה היא שארגונים רבים משתמשים באותם כלים או מפתחים יכולות דומות, ולא יוצרים יתרון תחרותי רב. זה כאילו כולם בחרו להשתמש באותן לבנים כדי לבנות בית שנראה בדיוק כמו הבית שליד. הערך, לעומת זאת, נובע לא רק מהלבנים עצמם אלא גם מהאופן שבו הם מורכבים - החזון והעיצוב להרכבת הלבנים האלה לבית שאנשים ירצו לקנות.
כדי להשיג בידול, מנהלי הנתונים צריכים להתמקד באסטרטגיות נתונים שיכולות לספק יתרון תחרותי, כגון:
התאמה של מודלים באמצעות נתונים קנייניים. הכוח של LLMs ו-SLMs נובע מהיכולת של חברה להכשיר אותם על מערכי הנתונים הקנייניים שלה ולהתאים אותם באמצעות הנדסה מיידית ממוקדת.
שילוב נתונים וטכנולוגיות. שילוב של מקרי שימוש ב-Gen AI ו-AI יישומי, למשל, יכול ליצור יכולות מבדלות, כמו שימוש ב-AI כדי לפתח מודלים חזויים לנתוני התנהגות משתמשים והזנת התובנות הללו למודלים של AI ליצירת תוכן מותאם אישית.
מסלולים לפיתוח יכולות
קלות השימוש בכלים בסיסיים רבים והזמינות הגוברת שלהם יצרו ריבוי של מקרי שימוש, פיילוטים ויישומים מנותקים לעתים קרובות. ההתלהבות סביב ה-Gen AI בפרט משמעותה שמנהלי נתונים כבר לא צריכים לדחוף את "ערך הנתונים" לעמיתיהם. במקום זאת, הם נאבקים לנהל את ביקושי ה"משיכה" מהם. זה מעלה שתי סוגיות:
צוותים בארגון משיקים מודלים של הוכחת קונספט ויישומים מבוססי בינה מלאכותית שאין להם סיכוי להרחיב קנה מידה,
בעלי עניין שונים משקיעים במקרים שימוש הטרוגניים הדורשים הערכות רחבה -החל ממודולים של מחסני נתונים וה-AI ובניית ארכיטקטורות כוללת ושלמות מראש לפני שניתן יהיה לממש את הערך.
כדי לאפשר את קנה המידה הנדרש להפעלת עסקים מונעי נתונים בשנת 2030, מנהלי נתונים יזדקקו לגישה שמאיצה את האופן שבו מקרי שימוש מספקים השפעה תוך פתרון לקנה מידה באמצעות ארכיטקטורה שיכולה לתמוך בארגון. כדי להשיג זאת, מנהלי נתונים צריכים לבנות "מסלולי יכולות", שהם רכיבי טכנולוגיה מקובצים המאפשרים יכולות שניתן להשתמש בהן למקרי שימוש מרובים (התרשים הבא).
פיתוח וקיום מסלולי יכולות תלוי בחלקו בחשיבה דרך בחירות קריטיות של ארכיטקטורת נתונים. הבחירות בדרך כלל מתחלקות בין גישה ריכוזית עם אגם נתונים מנוהל בקפידה, לבין גישה מבוזרת, לפיה ליחידות עסקיות מקומיות יש בעלות מלאה על הנתונים שלהן. וגישה מאוחדת שעשויה להשתמש בכל רשת הנתונים .
גישה מבוזרת תקשה על יצירת מסלולי יכולות שניתן להשתמש בהם ברחבי הארגון, בעוד שגישה ריכוזית יותר דורשת השקעה נוספת ביכולות ממשל ופיקוח. הבחירה למשל בספק שירותי ענן, עם מערך הכלים והיכולות המשובצים שלו, תשפיע גם על אופן פיתוח מסלולי היכולות.
החיים בעולם נתונים לא מובנה
חברות עובדות כבר עשרות שנים עם נתונים מובנים כמו, מפרטי מוצרים, עסקאות ויתרות מאורגנות לפי נתוני אב ונתוני ייחוס שהם רק 10 אחוז מהנתונים הזמינים. ה-Gen AI פתח את 90 האחוזים האחרים של הנתונים, שאינם מובנים כמו, סרטונים, תמונות, צ'אטים, מיילים ועוד.
מנעד זו של נתונים יכולה להעשיר מאוד את היכולות של חברות, במיוחד בשילוב עם מקורות נתונים אחרים. דוגמאות עשויות לכלול שימוש בביקורות, פוסטים במדיה חברתית והיסטוריית רכישות כדי לאפשר לסוכני בינה מלאכותית ליצור הצעות לקוחות מותאמות אישית או לנתח חוזים ותנאים מעסקאות קודמות כדי לנהל משא ומתן על ספקים, הצטרפות, מימוש ועדכוני חוזים.
אבל קנה המידה והמגוון של הנתונים הלא מובנים הם נושא מורכב יותר, נתונים לא מובנים הם פחות עקביים, פחות זמינים וקשים יותר להכנה ולטיוב - מאתגרים עוד יותר בגלל היקף הנתונים. כאנלוגיה, זה כמו להשקיע מאמץ בפיתוח ולנהל את הצינורות והמערכות למי שתייה ופתאום לקבל את המשימה לנהל אוקיינוס של מים. עם נפחי הנתונים שצפויים לגדול ביותר מפי עשרה מ-2020 ל-2030, הנושא הזה לא הולך להיות קל יותר בקרוב.
יצירת ערך מנתונים לא מובנים היא מאמץ גדול ועתיר הרבה יותר ממה שרבים מבינים. אתגרים משמעותיים כוללים דרישות טיוב ותיוג, חששות פרטיות והטיה, עלויות אחסון בענן ורשת מרקיעות שחקים, ולעתים קרובות תהליכי המרה יקרים. מנהלי הנתונים יצטרכו להשקיע בבניית יכולות חדשות כגון עיבוד שפה טבעית כדי לעזור להמיר את הנתונים הלא מובנים כך ש-LLMs יוכלו "להבין" ולהשתמש בהם, כמו גם בבדיקה וכיול מחדש של LLMs ללא הרף כאשר המודלים ומקורות הנתונים המתאימים מתעדכנים .
מנהלי הנתונים יצטרכו להישאר ממוקדים בניהול מבול הנתונים הלא מובנים. זה אומר להשקיע זמן כדי למפות אילו חלקים של נתונים לא מובנים דרושים כדי להשיג את סדרי העדיפויות העסקיים ומוצרי נתונים קריטיים בצורה הטובה ביותר.
מנהיגות נתונים דורשת שת"פ
היכולת של חברות להשיג את חזון הנתונים וה-AI שלהן עד שנת 2030 תישען במידה רבה על מנהיגות. עד היום, רק מחצית ממנהלי הנתונים והאנליסטים הראשיים, למשל, מרגישים שהם מסוגלים להניע חדשנות באמצעות נתונים. 70 אחוז מהארגונים עם ביצועים עסקיים גבוהים מדווחים על קשיים, למשל, בפיתוח תהליכים לניהול נתונים ושילוב נתונים במודלים של AI במהירות.
נושא זה מסתכם לעתים קרובות באחריות לא ברורה, מערכי הכשרה למיומנויות מצומצמים או ממשל מנותק. במקרים מסוימים, מנהלי הנתונים מתמקדים בסיכון אך מנותקים מהמנהלים העסקיים שצריכים להשתמש בנתונים כדי לייצר הכנסות. באחרים, למנלים יש מנדט ברור להאיץ את יצירת הערך בתוך תחומים עסקיים ספציפיים, אך עם פרספקטיבה ארגונית מוגבלת.
כדי לעלות על המסלול הנכון, חברות צריכות למצוא מנהלים מיומנים בשלושה תחומים עיקריים:
ממשל וציות, תוך התמקדות כבדה בפעילויות הגנתיות (שמונעות בעיקר על ידי רגולציה וסיכוני סייבר); מנהיגים מסוג זה נמצאים בעיקר בתעשיות העומדות בדרישות גבוהות או בתעשיות עם ערך מידע גבוה.
הנדסה וארכיטקטורה, תוך התמקדות בתכנון טכני והסתכלות על כל בעיה כהזדמנות הנדסית לאוטומציה, שימוש חוזר והרחבה.
ערך עסקי, תוך התמקדות ביצירת הכנסות, צמיחה ויעילות מנתונים; מנהלים אלה עובדים לעתים קרובות בשיתוף פעולה הדוק עם העסק.
מציאת אדם בודד עם הכישורים, הלך הרוח והניסיון לכסות את כל שלושת התפקידים היא נדירה. עם זאת, מנהלי נתונים מוסמכים יכולים למלא את הצוותים שלהם באנשים שיש להם את התמהיל הנכון של מיומנויות, או שארגונים יכולים ליצור ועדת הפעלה המייצגת כל תחום יכולת. לא משנה איזה מודל ייבחר, זה ידרוש חסות מפורשת מלמעלה, דיונים עם מנהיגות רחבה יותר על תפקידים ואחריות, אחריות משותפת ותמריצים משותפים לפתרון עבור כל שלושת הדיסציפלינות.
מחזור החיים החדש של הכישורים
פרופיל הכישורים של ארגונים כנראה יראה שונה מאוד בשנת 2030. טכנולוגיות בינה מלאכותית כבר מתחילות להשתלט על משימות אנליטיות ותהליכיות בסיסיות, כגון יצירת קוד, יצירת מסמכים וסיווג וסינתזה של נתונים. עם הזמן, אנו יכולים לצפות מ-Gen AI וטכנולוגיות אחרות להתמודד עם משימות מתוחכמות יותר, כגון ייצור שושלת ופיתוח מוצרי נתונים, בזמן שהיצע של מעברי כישרונות ועבודות חדשות צצות.
השינויים הללו בדרך העבודה מחייבים את מנהלי הנתונים ו-AI לפתח תצוגה ברורה לגבי המיומנויות החדשות הנדרשות. חלק מהמיומנויות החדשות הללו ייקלטו בתפקידים קיימים, בעוד שאחרות ידרשו תפקידים חדשים לחלוטין (תרשים מצורף). מהנדסי נתונים, למשל, יצטרכו לפתח מגוון חדש של מיומנויות, כגון כוונון ביצועי מסד נתונים, עיצוב נתונים, DataOps (המשלב DevOps, הנדסת נתונים ומדעי נתונים, ופיתוח מסדי נתונים וקטוריים. תפקידים חדשים עשויים לכלול מהנדסים מהירים, דיילי אתיקה בינה מלאכותית ומומחי נתונים לא מובנים.
שינוי מיומנויות זה ידרוש ממנהיגי נתונים לעבוד עם הנהלת משאבי האנוש כדי לחשוב מחדש כיצד למצוא ולהכשיר אנשים למיומנויות שהם צריכים.
בדחף להגביר את הכישורים, אסור למנהלי נהתונים לשכוח תרבות. ניתוח מקינזי מראה שלמפתחי בינה מלאכותית ומשתמשים כבדים אכפת הכי הרבה מאנשים אמינים ותומכים, כמו גם ממנהיגים אכפתיים ומעוררי השראה: בערך שניים מכל חמישה אומרים שעבודה משמעותית וקהילה מכילה הם מניע מרכזי, אפילו מעל לגמישות.
שומרי הסף הדיגיטלי
סיכון הפך לתחום של דאגה רבה יותר עם עלייתן של טכנולוגיות מתקדמות - בעיקר AI ו-Gen AI. ממשלות זזות במהירות להפעיל תקנות חדשות, וחברות בוחנות מדיניות חדשה.
חלק מהנושאים היו ידועים, כמו הזיות כלומר, מודלים של GEN AI המספקים תשובות לא מדויקות, הטיה, זכויות קניין רוחני ופרטיות נתונים. אך מכיוון שהטכנולוגיות הללו כל כך חדשות ומתפתחות במהירות, נוף הסיכונים הרחב יותר לרוב אינו מובן היטב. שלושה סוגי סיכון בולטים:
סוגים חדשים של התקפות. הכוח של ה-Gen AI ללמוד ולהתפתח במהירות פותח את הדלת לסוגים חדשים לגמרי של התקפות, כולל תוכנות זדוניות המתפתחות בעצמן שלומדות מערכות פנימיות ומתפתחות לפרוץ הגנות, בוטים חכמים שיכולים לחקות יותר ויותר בני אדם ונתונים נגועים שמוכנסים.
הרחבת הסיכוי לסיכון. החיבורים הרחבים בין AI ומערכות נתונים - הן בתוך ומחוץ לארגונים - יצרו פוטנציאל גדול יותר לנזק.
סיכונים חדשים ולא ידועים חדשים. ככל שהאינטראקציה עם AI הופכת לשיחתית יותר ופחות עוסקת רק בחיפוש עובדות, חברות ייכנסו לאזור הרבה יותר מעורפל שמוגדר על ידי מערכות ערכים משתנות. ועם התפשטותם של סוכני בינה מלאכותית שבעצם "מדברים" זה עם זה, ככל הנראה יצוצו קטגוריות חדשות לגמרי של סיכון.
בנוסף לצורך להתעדכן בסוגי הסיכונים המתעוררים הללו, מנהלי הנתונים יצטרכו לחשוב מחדש על גישותיהם לסיכון. רבים עדיין מסתמכים יותר מדי על גישות מסורתיות לאיכות נתונים ותאימות, בעוד מעטים החלו ליישם בדיקות קידוד ואתיקה מתקדמות. הערכה מחודשת זו צריכה להיות מבוססת על ההבנה שניהול סיכונים הוא יתרון תחרותי, המושג על ידי בניית מותג המהווה שומר בטוח לפרנסת הלקוחות או פשוט על ידי הימנעות מהכשלים שעומדים בפני המתחרים. השקפה זו אמורה להניע עמדה פרואקטיבית יותר להתמודדות עם סיכונים מאשר רק להגיע לאמות מידה של תאימות.
מנהלי נתונים (ומנהלי טכנולוגיה באופן רחב יותר) יכולים לעמוד בקצב של בעיות הסייבר על ידי הטמעת יכולות בינה מלאכותית (ובסופו של דבר קוונטיות), כגון LLMs "יריבות" לבדיקת אימיילים שנוצרו על ידי LLM עבור תוכן לא הולם או לא חוקי, וערכות כלים להוגנות לבדוק הטיה.
לסיכום
ככל שהטכנולוגיה מחלחלת לעסקים ולחברה, חשיבות הנתונים תמשיך לעלות - וכך גם האתגרים הנלווים. רמות אי הוודאות והדינמיקה המשתנה במהירות של הטכנולוגיה גורמות לכך שיש היום מעט תשובות ברורות. אבל על ידי היצמדות לסדר העדיפויות החשוב ביותר והבנת מהות הבעיות העומדות בפניהם, מנהלי הנתונים יכולים לנווט נתיב לארגון מונע נתונים.
Comments