חפש בבלוג זה

יום שלישי, 15 במאי 2018

מה שלמדתי בכנס מידע 2018 : ויקידאטה





מתוך הרצאתה המרתקת של שני אבנשטיין , עמותת ויקימדיה ישראל ותנועת ויקימדיה העולמית: 

כנס מידע 2018 , מלון הילטון תל אביב  , 15.5.2018

בניגוד לויקיפדיה, הכוללת דפי טקסט ותמונות בפורמט חופשי לעריכה, המידע המאוחסן בויקידאטה מאורגן בטבלאות ושדות, ומכיל רק מידע עובדתי בסיסי. בדף הערך רוסיה, למשל, אפשר למצוא פרטים כמו שם עיר הבירה, שם הנשיא, מדינות גובלות ונתונים מספריים שונים ומגוונים , עם ציון המקורות לנתונים..

למיזם זה יש יכולת של האחדה וקישור בין מסדי מטא-דאטה של גופים שונים ומצד שני למיזמים חופשיים יש יכולת לחלץ נתוני מטא-דאטה ממיזם וויקי-נתונים.

בדומה לאופן הפעולה של ויקיפדיה, גם העבודה על ויקידאטה היא בצורה של עריכה שיתופית, עם דפי שיחה ושינויים. כל המידע המאוחסן בויקידטה פתוח לשימוש חופשי תחת רשיון קריאטיב קומונס.

מדובר למעשה במאגר ענק של עובדות ונתונים, הפתוח לשימוש הציבור ואף נערך על ידי המשתמשים בצורה שיתופית, בשיטה המוכרת לנו מויקיפדיה.
המידע בויקידאטה הוא מידע מובנה, המאופיין ברמה גבוהה של ארגון פנימי, המאפשרת למחשבים לסרוק אותו בקלות בעזרת אלגוריתמי חיפוש פשוטים- מה שהופך אותו למקור מידע אידיאלי עבור מנוע החיפוש גוגל .
דוגמא נוספת : מוזיאון MET בניו יורק
מיזם הWikidata הוא, למעשה אחד הביטויים של ה-  3.0WEB . זו שכבה של נתונים עובדתיים ברמת מטא-דאטא היושבת מעל הWEB הרגיל והופכת להיות WEB 3.0 . יש כאן קשר לרשת הסמנטית של האינטרנט, אלו הם נתונים מובנים ומקושרים (Structured and linked data ) אותם ניתן לחלץ מהויקי-נתונים ע"י מיזמים חופשיים באינטרנט . לדוגמא מיזם  Histropedia.com מבוסס על הויקידאטא (וויקי-נתונים) . בלחיצת כפתור ניתן לראות באתר חיתוכים שונים והצלבות מידע המוצגים בטיים-ליין/ צירי זמן המוצגים בצורה רציפה בציר זמן גראפי .



 גם מנוע החיפוש של גוגל מחלץ נתונים מתוך מסד הנתונים האדיר של ויקידאטה :

  לדוגמא :



 שאילתות במאגר וויקי-נתונים

 יש גם אפשרות לבצע שאילות מורכבות בוויקי נתונים :


ראו גם :



Mix'n'Match - Wikidata  כלי עזר המאפשר הצלבה בין קטלוגים חיצוניים לבין ויקידאטה וכשעובדים איתו זו דרך להוסיף נתונים לויקידאטה,









אין תגובות:

הוסף רשומת תגובה

לקט nידעני מס' 18 , 27 למרץ 2024

הלקט המידעני ה-18, כמו קודמיו, נועד להקנות לכם תמונת מצב מעודכנת של תחומי המידענות , ניהול התוכן , מנועי החיפוש והספריות והוא מבוסס על איסוף...