פייסבוק – מאגר הנתונים מהחלומות

כשרק התחלתי להתעסק במוצרים ברשת, אחרי שנים של לימודי פסיכולוגיה,  חיפשתי כל הזמן מחקרים ונתונים. החל מנתוני טראפיק בסיסיים (למשל כמה אנשים גולשים לאתר מסוים), ועד למחקרים הרבה יותר מעמיקים בנושאים של שימושיות. חלק מהנתונים די זמינים ברשת (מי אמר אלקסה?), אבל רובם ממש לא. המחקרים מעטים, אין הרבה חברות או גופים שחוקרים בצורה מקצועית ורצינית את הדברים האלה, אין הרבה מחקרים באקדמיה, ובאופן כללי הרגשתי שחסרים לי מספרים.

לאט לאט אני מוצאת יותר מחקרים שנערכים ומתפרסמים, ויותר מומחים ברשת שחולקים את המידע הזה. מצאתי שהמקור לנתונים האלה שונה ממה שצפיתי. פחות מאשר ספרים וג'ורנלים של מחקרים פרופר (כמו שהייתי רגילה מעולם הפסיכולוגיה), הרבה מהנתונים האלה מתפרסמים בבלוגים של אנשי מקצוע ספציפים, או משותפים בכנסים מקצועיים על ידי חברות/יועצים שעשו מחקרים כאלה לצרכים שלהם.

לאחרונה פייסבוק פרסמו שהם מציעים מילגות לחוקרים, שיחקרו נושאים שמעניינים אותם וחשובים להם, והרגשתי איך פתאום מנהלת המוצר שבי לוקחת צעד אחורה, והבחורה שיש לה שני תארים בפסיכולוגיה מתעוררת. אם היתה לי גישה למאגר הנתונים של פייסבוק, הייתי שוקלת ברצינות מחקר אקדמי מתקדם. בימי כסטודנטית לפסיכולוגיה תמיד הטרידה אותי העובדה שכל המחקרים בפסיכולוגיה (כמעט) נעשים על סטודנטים של שנה ראשונה במדעי החברה. האם הם באמת מדגם מיצג למשהו?

לפייסבוק יש בסיס נתונים מדהים, שאפשר בעזרת ניתוח סטטיסטי להוציא ממנו כל כך הרבה. אני חיבת להודות שמבחינה זו הרבה יותר מענין אותי המידע בפני עצמו, מאשר המידע שיעזור למפרסמים ויגדיל את הרווחים של פייסבוק, אבל בעצם אין הרבה סתירה בינהם.

ניתוח של רשתות לפי פייסבוק

ניתוח של רשתות לפי פייסבוק

המקור לתמונה: http://www.northwestern.edu/newscenter/stories/2009/12/networks.html

רשימת הנושאים שפייסבוק פרסמה מעניינת, ובמידה מסוימת נותנת אינדיקציה לתחומים שבהם פייסבוק רוצים להתפתח – החל ממודלים של חישובים ענניים למינהם,  פיתוח אלגורתמים של מכירות פומביות ופרסומות,  מודלים של כריית נתונים, חיפוש וכו'.

שני נושאים מהרשימה עניינו אותי במיוחד:

Social Computing: models, algorithms and systems around social networks, social media, social search and collaborative environments.

Data Mining and Machine Learning: learning algorithms, feature generation, and evaluation methods to produce effective online and offline models of behavioral signals.

אין ספק שבסיס הנתונים של פייסבוק הוא עצום, ואפשר ללמוד ממנו המון.  אם מניחים שפייסבוק הוא כלי שמאפשר שמירה על קשר, עוד אמצעי תקשורת בנוסף לאחרים, הרי יש כל כך הרבה שאלות שאפשר לשאול, החל מתדירות התקשורת (בין חברים, בני משפחה, חברים רחוקים פיסית), ועד ל"טיפוסי המשתמשים" (המפרסמים, המגיבים, השקטים).

כמה שאלות לדוגמא:

  • האם האנשים שמפרסמים הכי הרבה, הם גם אלה שיש להם הכי הרבה קשרים? האם הם גם אלה שמגיבים הכי הרבה לאנשים אחרים? האם יש קשר לסוג הפרסומים (למשל – האם הם מפרסמים את עצמם, או מקשרים לאחרים, האם הם עושים שימוש מקצועי או אישי בקשרים האלה, וכו').
  • קשרים משפחתיים/קשרים חברתיים/קשרים מקצועיים – האם יש הבדל בין סוג/תדירות התקשורת בין אנשים שמגדירים את הקשרים בינהם בצורה אחרת?
  • מרחק פיסי – האם יש קשר בין המרחק הפיסי בין אנשים לבין כמות התקשורת בינהם בפלטפורמה כמו פייסבוק? כלומר – האם הוא באמת מקרב רחוקים ומחזק קשרים, או שהוא בעצם רק חיווי נוסף של הקשרים הקיימים והעוצמה שלהם בחיים מחוץ לרשת?

לשאלות האלה ולמחקר כזה יכולים כמובן להיות גם יישומים רבים, לפייסבוק ברמה העסקית, וגם לעולם של מדעי החברה. וכל זה רק על סמך נתונים שאנשים "מוסרים" מעצם השימוש שלהם בפייסבוק, עוד לא התחלנו לשאול אותם שאלות, לבנות פרופילים, וכו'.

אני מאוד מקווה שפייסבוק יאפשרו ויעודדו שימוש בבסיס הנתונים הזה ללימוד על העולם והחברה, מעבר למה שהם צריכים לצורך העסקים. הלוואי.

_________________________________________

מחשבות בנושאים קשורים:

יומולדת לפייסבוק

webtrends בויז'ואל

ניתוח של רשתות לפי פייסבוק

פוסטים קשורים (בדרך זו או אחרת)

5 תגובות

  1. הבעיה עם נתונים מפייסבוק היא שגם קבוצת משתמשי פייסבוק אינה בהכרח יותר הטרוגנית מקבוצת סטודנטים שנה א' במדעי החברה.
    למרות מה שהיינו רוצים להאמין, עדיין לא כל הסבתות (וגם לא כל ההורים, האחים והאחיות הבוגרים וכו') וגם לא כל הצעירים מחוברים לפייסבוק.

    ואפילו בין אלו שמחוברים, יש את אלו שפשוט פתחו חשבון בשביל להבין על מה כל הרעש ולא השתמשו מאז באתר בכלל.

    לדעתי דווקא בתחום זה, אתרים ממוקדים יותר עדיפים.
    רשימת החברים שלי (ולדעתי של רוב המשתמשים) מכילה גם חברים, גם בני משפחה וגם מכרים מקצועיים (כלומר, חברים לעבודה) בעוד
    שבאתרים כגון LinkedIn רוב האנשים השרימת החברים הם קולגות מקצועיות.

  2. הדס שיינפלד

    אני לא מסכימה איתך בכלל. קודם כל – אין שום ספק שמשתמשי פייסבוק הם קבוצה יותר הטרוגנית מהסטודנטים. אפילו אם תטען שזו אותה קבוצת גיל (וזה לא!), אז לפחות הזוית הבינלאומית מוסיפה. אבל יש גם נתונים שקבוצות הגיל הרבה יותר מגוונות.
    אני גם חושבת שהעובדה שיש שם סוגי קשרים שונים היא יתרון בהקשר של המחקר, ולא חסרון. זו בדיוק הנקודה המעניינת – עם מי שומרים על קשר, ואיזה סוג של קשר. וגם אלה שלא משתמשים – הם חלק מהנתונים, ואפשר ללמוד מהם.
    בקיצור – אני אשאר עם ה-DB של פייסבוק, אתה יכול להשתמש בזה של לינקדאין.

  3. פינגבק:בלוגיק: נבחרי השבוע מהבלוגספירה הישראלית [29-01-10] | Newsgeek

  4. אחלה לקרוא.
    אני חושב שכל מחקר שיעשה על הנתונים הקיימים בפייסבוק
    כדאי ויהיה ללא התערבות של המשתמשים. אני מתייחס לסיומת הפוסט
    כשכתבת "עוד לא התחלנו לשאול אותם שאלות"
    אם איסוף המידע יהיה מהתצרוכת היומיומית של המשתמשים,
    מאשר התערבות ובקשת 10 דקות מזמנם לענות על שאלון
    או אז המסקנות יהיו 'נקיות' יותר(?) טבעיות יותר..

  5. הדס שיינפלד

    אני מסכימה שברגע שאתה מתחיל לשאול את המשתמשים שאלות, אתה מיד מגביל את המדגם שלך למי שמוכן לענות, ו"מלכלך" את התוצאות. למרות שגם אז, סביר שזה עדין יהיה מדגם יותר רחב מאשר סטודנטים שנה א' לפסיכולוגיה.
    בשלב ראשון צריך את הנתונים הקיימים, והם יכולים להיות בסיס להמוני מחקרים, כמו שהם.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *