הבלוגרית » ארכיון הבלוג » פייסבוק – מאגר הנתונים מהחלומות

פייסבוק – מאגר הנתונים מהחלומות

כשרק התחלתי להתעסק במוצרים ברשת, אחרי שנים של לימודי פסיכולוגיה,  חיפשתי כל הזמן מחקרים ונתונים. החל מנתוני טראפיק בסיסיים (למשל כמה אנשים גולשים לאתר מסוים), ועד למחקרים הרבה יותר מעמיקים בנושאים של שימושיות. חלק מהנתונים די זמינים ברשת (מי אמר אלקסה?), אבל רובם ממש לא. המחקרים מעטים, אין הרבה חברות או גופים שחוקרים בצורה מקצועית ורצינית את הדברים האלה, אין הרבה מחקרים באקדמיה, ובאופן כללי הרגשתי שחסרים לי מספרים.

לאט לאט אני מוצאת יותר מחקרים שנערכים ומתפרסמים, ויותר מומחים ברשת שחולקים את המידע הזה. מצאתי שהמקור לנתונים האלה שונה ממה שצפיתי. פחות מאשר ספרים וג'ורנלים של מחקרים פרופר (כמו שהייתי רגילה מעולם הפסיכולוגיה), הרבה מהנתונים האלה מתפרסמים בבלוגים של אנשי מקצוע ספציפים, או משותפים בכנסים מקצועיים על ידי חברות/יועצים שעשו מחקרים כאלה לצרכים שלהם.

לאחרונה פייסבוק פרסמו שהם מציעים מילגות לחוקרים, שיחקרו נושאים שמעניינים אותם וחשובים להם, והרגשתי איך פתאום מנהלת המוצר שבי לוקחת צעד אחורה, והבחורה שיש לה שני תארים בפסיכולוגיה מתעוררת. אם היתה לי גישה למאגר הנתונים של פייסבוק, הייתי שוקלת ברצינות מחקר אקדמי מתקדם. בימי כסטודנטית לפסיכולוגיה תמיד הטרידה אותי העובדה שכל המחקרים בפסיכולוגיה (כמעט) נעשים על סטודנטים של שנה ראשונה במדעי החברה. האם הם באמת מדגם מיצג למשהו?

לפייסבוק יש בסיס נתונים מדהים, שאפשר בעזרת ניתוח סטטיסטי להוציא ממנו כל כך הרבה. אני חיבת להודות שמבחינה זו הרבה יותר מענין אותי המידע בפני עצמו, מאשר המידע שיעזור למפרסמים ויגדיל את הרווחים של פייסבוק, אבל בעצם אין הרבה סתירה בינהם.

ניתוח של רשתות לפי פייסבוק

ניתוח של רשתות לפי פייסבוק

המקור לתמונה: http://www.northwestern.edu/newscenter/stories/2009/12/networks.html

רשימת הנושאים שפייסבוק פרסמה מעניינת, ובמידה מסוימת נותנת אינדיקציה לתחומים שבהם פייסבוק רוצים להתפתח – החל ממודלים של חישובים ענניים למינהם,  פיתוח אלגורתמים של מכירות פומביות ופרסומות,  מודלים של כריית נתונים, חיפוש וכו'.

שני נושאים מהרשימה עניינו אותי במיוחד:

Social Computing: models, algorithms and systems around social networks, social media, social search and collaborative environments.

Data Mining and Machine Learning: learning algorithms, feature generation, and evaluation methods to produce effective online and offline models of behavioral signals.

אין ספק שבסיס הנתונים של פייסבוק הוא עצום, ואפשר ללמוד ממנו המון.  אם מניחים שפייסבוק הוא כלי שמאפשר שמירה על קשר, עוד אמצעי תקשורת בנוסף לאחרים, הרי יש כל כך הרבה שאלות שאפשר לשאול, החל מתדירות התקשורת (בין חברים, בני משפחה, חברים רחוקים פיסית), ועד ל"טיפוסי המשתמשים" (המפרסמים, המגיבים, השקטים).

כמה שאלות לדוגמא:

  • האם האנשים שמפרסמים הכי הרבה, הם גם אלה שיש להם הכי הרבה קשרים? האם הם גם אלה שמגיבים הכי הרבה לאנשים אחרים? האם יש קשר לסוג הפרסומים (למשל – האם הם מפרסמים את עצמם, או מקשרים לאחרים, האם הם עושים שימוש מקצועי או אישי בקשרים האלה, וכו').
  • קשרים משפחתיים/קשרים חברתיים/קשרים מקצועיים – האם יש הבדל בין סוג/תדירות התקשורת בין אנשים שמגדירים את הקשרים בינהם בצורה אחרת?
  • מרחק פיסי – האם יש קשר בין המרחק הפיסי בין אנשים לבין כמות התקשורת בינהם בפלטפורמה כמו פייסבוק? כלומר – האם הוא באמת מקרב רחוקים ומחזק קשרים, או שהוא בעצם רק חיווי נוסף של הקשרים הקיימים והעוצמה שלהם בחיים מחוץ לרשת?

לשאלות האלה ולמחקר כזה יכולים כמובן להיות גם יישומים רבים, לפייסבוק ברמה העסקית, וגם לעולם של מדעי החברה. וכל זה רק על סמך נתונים שאנשים "מוסרים" מעצם השימוש שלהם בפייסבוק, עוד לא התחלנו לשאול אותם שאלות, לבנות פרופילים, וכו'.

אני מאוד מקווה שפייסבוק יאפשרו ויעודדו שימוש בבסיס הנתונים הזה ללימוד על העולם והחברה, מעבר למה שהם צריכים לצורך העסקים. הלוואי.

_________________________________________

מחשבות בנושאים קשורים:

יומולדת לפייסבוק

webtrends בויז'ואל

ניתוח של רשתות לפי פייסבוק

תגים: , ,

הפוסט נכתב ב יום שישי, 29 ינואר, 2010ב 9:42 בקטגוריה כללי, מוצר, רשתות חברתיות. אפשר לעקוב אחרי התגובות לפוסט הזה באמצעות ה RSS 2.0 רסס. אפשר להגיב, או לטראקבק מהאתר שלך



5 תגובות על “פייסבוק – מאגר הנתונים מהחלומות”

  1. לירון אומר/ת:

    הבעיה עם נתונים מפייסבוק היא שגם קבוצת משתמשי פייסבוק אינה בהכרח יותר הטרוגנית מקבוצת סטודנטים שנה א' במדעי החברה.
    למרות מה שהיינו רוצים להאמין, עדיין לא כל הסבתות (וגם לא כל ההורים, האחים והאחיות הבוגרים וכו') וגם לא כל הצעירים מחוברים לפייסבוק.

    ואפילו בין אלו שמחוברים, יש את אלו שפשוט פתחו חשבון בשביל להבין על מה כל הרעש ולא השתמשו מאז באתר בכלל.

    לדעתי דווקא בתחום זה, אתרים ממוקדים יותר עדיפים.
    רשימת החברים שלי (ולדעתי של רוב המשתמשים) מכילה גם חברים, גם בני משפחה וגם מכרים מקצועיים (כלומר, חברים לעבודה) בעוד
    שבאתרים כגון LinkedIn רוב האנשים השרימת החברים הם קולגות מקצועיות.

  2. הדס שיינפלד אומר/ת:

    אני לא מסכימה איתך בכלל. קודם כל – אין שום ספק שמשתמשי פייסבוק הם קבוצה יותר הטרוגנית מהסטודנטים. אפילו אם תטען שזו אותה קבוצת גיל (וזה לא!), אז לפחות הזוית הבינלאומית מוסיפה. אבל יש גם נתונים שקבוצות הגיל הרבה יותר מגוונות.
    אני גם חושבת שהעובדה שיש שם סוגי קשרים שונים היא יתרון בהקשר של המחקר, ולא חסרון. זו בדיוק הנקודה המעניינת – עם מי שומרים על קשר, ואיזה סוג של קשר. וגם אלה שלא משתמשים – הם חלק מהנתונים, ואפשר ללמוד מהם.
    בקיצור – אני אשאר עם ה-DB של פייסבוק, אתה יכול להשתמש בזה של לינקדאין.

  3. בלוגיק: נבחרי השבוע מהבלוגספירה הישראלית [29-01-10] | Newsgeek אומר/ת:

    [...] שיינפלד מהבלוג "הבלוגרית" כתבה השבוע על כך שפייסבוק פרסמו שהם מציעים מילגות לחוקרים, שיחקרו נושאים שמעניינים אותם וחשובים להם. היא מציגה [...]

  4. אילן פאר אומר/ת:

    אחלה לקרוא.
    אני חושב שכל מחקר שיעשה על הנתונים הקיימים בפייסבוק
    כדאי ויהיה ללא התערבות של המשתמשים. אני מתייחס לסיומת הפוסט
    כשכתבת "עוד לא התחלנו לשאול אותם שאלות"
    אם איסוף המידע יהיה מהתצרוכת היומיומית של המשתמשים,
    מאשר התערבות ובקשת 10 דקות מזמנם לענות על שאלון
    או אז המסקנות יהיו 'נקיות' יותר(?) טבעיות יותר..

  5. הדס שיינפלד אומר/ת:

    אני מסכימה שברגע שאתה מתחיל לשאול את המשתמשים שאלות, אתה מיד מגביל את המדגם שלך למי שמוכן לענות, ו"מלכלך" את התוצאות. למרות שגם אז, סביר שזה עדין יהיה מדגם יותר רחב מאשר סטודנטים שנה א' לפסיכולוגיה.
    בשלב ראשון צריך את הנתונים הקיימים, והם יכולים להיות בסיס להמוני מחקרים, כמו שהם.

השאירו תגובה