יום שישי, 18 במאי 2018

SUMMURAI- פלפטפורמה ליצירה ולהנגשה של סיכומי תכנים Online


 בסיום כינוס מידע 2018 העניקה חברה טלדן מערכות מידע את פרס פינקלר למידע עבור חדשנות וערך מוסף לשירותי המידע בישראל למר טל פלורנטין ולפלטפורמת התימצות המקוון  Summurai  שפיתח .  

  

בכל שבוע מתפרסמים בעולם 100,000 מאמרים חדשים ומיליון פוסטים בבלוגים , ונניח שיש 3-4 מאמרים מעניינים באנגלית שחשובים לכם לדעת , אבל אין לכם זמן לקרוא אותם . 

הבנת טקסטים ארוכים דורשת השקעה רבה והתוצאה היא שאנו , כאנשי מקצוע, ממעטים לקרוא ספרות מקצועית.

נוכח אילוצים אלו יש ערך רב במידע מתומצת היטב.



כאן בא לעזרתכם טל פלורנטין ופלטפורמת Summurai שהוא יזם ופיתח.  

המטרה של הפלטפורמה החדשנית היא להנגיש תוכן בצורה הטובה ביותר לצריכה ולהבנה של אנשי מקצוע .

שירות מידע זה מבוסס על תוסף שמותקן בדפדפן, באמצעותו, בכל פעם שנתקלים במאמר שרוצים לדעת מה כתוב בו, לוחצים על הכפתור ושולחים אותו לפלטפורמת Summurai לסיכום.

צוות הפלפטפורמה קורא את המאמר הארוך ומסכם אותו היטב ב300-400 מילים.

הייחודיות של הפלפטפורמה (בתשלום) שמקבלים בנוסף לסיכום המאמר גם קובץ קול (Playlist) שבו קריין מקריא באנגלית את הסיכום בצורה ברורה) . כך תוכלו לשמוע את סיכום המאמר במהלך הנסיעה במכונית או במהלך ההליכה היומית שלכם.

סיכום גם של הרצאות בכנסים המובילים בעולם


במסגרת פלטפורמת Summurai  ניתן לקבל גם סיכומים  מכנסים מובילים בעולם

זהו השירות הראשון והיחיד בעולם שמביא עד אליכם גם את סיכום ההרצאות של הכנסים המובילים בעולם, לפלייליסט ממוקד, קצר ונוח, שאפשר לצרוך בקריאה+שמיעה..

מתוך הראיון עם טל פלורנטין היוזם והמפתח של Summurai :

"השאלה הראשונה שתמיד מתעוררת היא – "איך האלגוריתם שלכם מסכם?" התשובה פשוטה – הוא לא. אין אלגוריתם. השירות מבוסס כולו על בני אדם. הסיכום מבוצע מאחורי הקלעים על ידי סטודנטים אמריקאיים, וההקראה – על ידי קריינים מקצוענים. המערכת מנהלת שני 'מרקטפלייסים' של ספקי שירות, המספקים מענה לצורך, באמצעות ממשקי משתמש ייחודיים שנבנו עבורם.

מי קהל היעד הישיר של המוצר?

"התשובה המהירה היא "כולם", אבל כמי שעוסק בחוויית משתמש, אני הראשון שיצהיר שאסור לענות תשובה כזו. הקהל המפוקס יותר הוא אנשי מקצוע מקצוענים בתחומם, שצריכים להיות מעודכנים ושיש לשעה שלהם ערך מוגדר ומשמעותי. יזמים, יועצים, מנהלים, מעצבים, מרצים ועוד. לכל אלו – הצורך להישאר מעודכנים הוא מרכיב קריטי בעבודתם, ומאחר ולכל זמן מבוזבז יש מחיר, כלי עזר כזה,  ממשפחת כלי שיפור הפרודוקטיביות, הוא בעל ערך אדיר עבורם. "

Summurai
 נולד מתוך חוסר היכולת שלי להתמודד עם עומס המידע של המאה הזו

כאיש חוויית משתמש, אני נדרש לדעת הכל בקשת מאד רחבה של עולמות תוכן – טכנולוגיה, חדשנות, יזמות, עיצוב, כתיבה שיווקית, מודלים עסקיים, שוק הסטארטאפים, ועוד ועוד.

לאורך הדרך, נתקלתי בפלטפורמות Crowd Sourcing והתחלתי להיעזר בכוח עבודה משלים למשימות מיוחדות.

מתוך ההתמודדות עם העומס, ניסיתי את מזלי ונעזרתי במישל מהפיליפינים. המודל היה פשוט.  בכל פעם שנתקלתי במאמר שלא היה דחוף, אבל רציתי לדעת מה כתוב בו, שמתי קישור שלו בגוגל דוק וביקשתי ממישל לסכם את המאמר ולשלוח לי את הסיכום במייל.

כשהתחלתי לקבל את הסיכומים – ולא עמדתי בעומס שלהם גם, שמתי אותם בתיקיה בשם "סיכומים שצריך לקרוא"…. מתוך ההבנה שיש כוח עזר שיוכל לעזור לי, שכרתי את שירותיו של קריין אמריקאי. ביקשתי ממישל לשלוח אליו את הסיכומים, במקום אלי, וממנו – שישלח לי את הקובץ הקולי כMp3. 

כשהתחלתי לקבל את קבצי ה-MP3  ולשמוע אותם היתה תחושה אדירה של סיפוק. זה פשוט עבד.


  

יום חמישי, 17 במאי 2018

מה שלמדתי בכנס מידע 2018 : מסנני Full – Text במאגר החינוכי ERIC



   מתוך הרצאתה המרתקת של המידענית טל קמינסקי רוזנברג בכנס מידע 2018 , 16 במאי , מלון הילטון תל אביב .


כיום מידענים , אנשי חינוך, מרצים ותלמידי מחקר אינם מסתפקים עוד בחיפוש ביבליוגראפי של תקצירים לבד  אלא זקוקים יותר ויותר למאמר המלא בטקסט ( Full-Text).

 מאגר המידע החינוכי ERIC  החופשי באינטרנט היה אחד החלוצים בהנגשת מאמרים בטקסט מלא , לצד התקציר .  

במאגר העצום של ERIC ניתן להפעיל מסננים שיאפשרו קבלת תוצאות החיפוש רק בFull – Text  כפי שניתן לראות בצילומי המסך הבאים :



על מאגר ERIC

ERIC (ראשי תיבות של "Education Resources Information Center" - בעברית, "מרכז מקורות מידע על חינוך") הוא שמו של מאגר מידע ביבליוגרפי, העוסק בתחום מדעי החינוך. המאגר מכיל רישום ביבליוגרפי של 1.6 מיליון פרסומים, מאמרים מדעיים בעלי ביקורת עמיתים, חסרי ביקורת עמיתים, ספרים, נירות עמדה, סיכומי כינוסים מדעיים ופרסומים אחרים בתחום החינוך שפורסמו החל משנת 1966 בשפה האנגלית.

המאגר הממומן על ידי מחלקת החינוך של ארצות הברית, מאפשר לגולשים גם להציע חומר להוספה אל מאגר המידע.

בשנת 2008 הורחבו תחומי הסיקור של שיטות המחקר השונות הקשורות לחינוך ולמדעי החברה. היקף המאמרים והמחקרים בתחומי שיטות המחקר מכסה הן את תחומי המחקר האיכותני והן את תחומי המחקר הכמותי.

מסנני חיפוש: החיפוש כיום במאגר ERIC הוא הרבה יותר פרמטרי ומדויק. כאשר מחפשים במצב ADVANCED SEARCH ניתן להגביל מבחינת הז'אנרים את השאילתא לעשרות סוגי חומרים וסוגי מחקרים עפ"י הסימון בתיבה נגללת





מה שלמדתי בכנס מידע 2018 :חדשנות דיגיטלית בפרוייקט בן- יהודה

מתוך הרצאתה של שני אבנשטיין ,   כנס מידע 2018 , מלון הילטון תל אביב , 15 למאי 2018

 פרוייקט בן-יהודה הקדים את כולם , את הוויקיפדיה, הפייסבוק ואחרים, והיום יש להם מיליון כניסות לחודש !!



בשנת 1999, אסף ברטוב, איש תוכנה ישראלי, החל להקליד בהתנדבות שירה עברית. לימים הצטרפו אליו מתנדבים נוספים שנענו להודעה קטנה שפרסם בתחתית השירה שהעלה לרשת, וכך נולד פרויקט בן-יהודה.

הפרויקט שואב את השראתו מפרויקט דומה בשפה האנגלית (ולימים גם בשפות נוספות) הנקרא פרויקט גוטנברג יוזמה של ד"ר מייקל ס’ הארט המנוח. הנה קישור למידע נוסף אודות הפרויקט הלועזי באתר הרשמי של פרויקט גוטנברג.

מטרות פרויקט בן -יהודה הן שימור היצירות העבריות, הנגשת היצירות לציבור הרחב, וחשיפת היצירות לקוראים חדשים ועידוד העיסוק בהן. האתר משמש סטודנטים, חוקרים, מורים, תלמידים, וחובבי ספרות באשר הם, ונהנה מכמליון צפיות בכל חודש מישראל ומרחבי העולם.

במאגר של אתר בן יהודה יותר מ1000 יצירות מלאות בעברית.


פרויקט בן-יהודה הוא מיזם התנדבותי, ובמסגרתו פועלים מאות מתנדבים ליצירת מהדורות אלקטרוניות של ספרות עברית, והנגשתן לציבור במאגר יצירה עברית, חופשי בשימוש וחינם אין כסף, באמצעות אתר אינטרנט. 

הם סורקים ספרים נדירים . הם מגלים הרבה טקסטים ספרותיים איכותיים שהיו חבויים ולא פורסמו ומעלים אותם בפעם הראשונה לאתר שלהם באינטרנט. יש שיתוף פעולה רב עם הספריה הלאומית לאיתור ספרים נדירים וניתן לראותם באתר פרוייקט בן יהודה. 

לאחר 18 שנות פעילות, פותח אתר תוכן חדש לפרויקט בן-יהודה, שיש בו חדשנות דיגיטלית
  • ניתן לראות מיד בכניסה לאתר מי הם היוצרים הנקראים ביותר באתר . 
  • ניתן לראות באופן ברור מיון של יצירות עפ"י סוגה, 
  • ניתן לראות את 10 היצירות הנקראות ביותר בחודש ועוד .




בתכנון לשנה הקרובה :

שכבות ביאור והערות – קוראים וחוקרים מבקשים לקבל דרך להוסיף הערות, פרטיות או פומביות, ליצירות. הערות יכולות לספק ביאורים למלים או צירופים קשים, להוסיף מידע והקשרים היסטוריים, או להעלות שאלות וספקות לגבי הטקסטים באתר.

יצירת מערכת לניהול משתמשים – המערכת תאפשר יצירת רשימות קריאה ע"י משתמשים, כך שכל משתמש יוכל ליצור אנתולוגיה משלו מתוך כל היצירות המופיעות באתר, לייצא את האנתולוגיה (למשל כקובץ PDF או כספר אלקטרוני), או לשתף אותה במדיה חברתית או בדואל. 

כמו כן תאפשר המערכת הוספת תגיות והמלצות ליצירות, סימון יצירות אהובות, ואפשרות של סימניות אישיות ליצירות שונות אותן קוראים במערכת.




יום שלישי, 15 במאי 2018

מה שלמדתי בכנס מידע 2018 : ויקידאטה





מתוך הרצאתה המרתקת של שני אבנשטיין , עמותת ויקימדיה ישראל ותנועת ויקימדיה העולמית: 

כנס מידע 2018 , מלון הילטון תל אביב  , 15.5.2018

בניגוד לויקיפדיה, הכוללת דפי טקסט ותמונות בפורמט חופשי לעריכה, המידע המאוחסן בויקידאטה מאורגן בטבלאות ושדות, ומכיל רק מידע עובדתי בסיסי. בדף הערך רוסיה, למשל, אפשר למצוא פרטים כמו שם עיר הבירה, שם הנשיא, מדינות גובלות ונתונים מספריים שונים ומגוונים , עם ציון המקורות לנתונים..

למיזם זה יש יכולת של האחדה וקישור בין מסדי מטא-דאטה של גופים שונים ומצד שני למיזמים חופשיים יש יכולת לחלץ נתוני מטא-דאטה ממיזם וויקי-נתונים.

בדומה לאופן הפעולה של ויקיפדיה, גם העבודה על ויקידאטה היא בצורה של עריכה שיתופית, עם דפי שיחה ושינויים. כל המידע המאוחסן בויקידטה פתוח לשימוש חופשי תחת רשיון קריאטיב קומונס.

מדובר למעשה במאגר ענק של עובדות ונתונים, הפתוח לשימוש הציבור ואף נערך על ידי המשתמשים בצורה שיתופית, בשיטה המוכרת לנו מויקיפדיה.
המידע בויקידאטה הוא מידע מובנה, המאופיין ברמה גבוהה של ארגון פנימי, המאפשרת למחשבים לסרוק אותו בקלות בעזרת אלגוריתמי חיפוש פשוטים- מה שהופך אותו למקור מידע אידיאלי עבור מנוע החיפוש גוגל .
דוגמא נוספת : מוזיאון MET בניו יורק
מיזם הWikidata הוא, למעשה אחד הביטויים של ה-  3.0WEB . זו שכבה של נתונים עובדתיים ברמת מטא-דאטא היושבת מעל הWEB הרגיל והופכת להיות WEB 3.0 . יש כאן קשר לרשת הסמנטית של האינטרנט, אלו הם נתונים מובנים ומקושרים (Structured and linked data ) אותם ניתן לחלץ מהויקי-נתונים ע"י מיזמים חופשיים באינטרנט . לדוגמא מיזם  Histropedia.com מבוסס על הויקידאטא (וויקי-נתונים) . בלחיצת כפתור ניתן לראות באתר חיתוכים שונים והצלבות מידע המוצגים בטיים-ליין/ צירי זמן המוצגים בצורה רציפה בציר זמן גראפי .



 גם מנוע החיפוש של גוגל מחלץ נתונים מתוך מסד הנתונים האדיר של ויקידאטה :

  לדוגמא :



 שאילתות במאגר וויקי-נתונים

 יש גם אפשרות לבצע שאילות מורכבות בוויקי נתונים :


ראו גם :



Mix'n'Match - Wikidata  כלי עזר המאפשר הצלבה בין קטלוגים חיצוניים לבין ויקידאטה וכשעובדים איתו זו דרך להוסיף נתונים לויקידאטה,









יום ראשון, 13 במאי 2018

ההבנייה מחדש של מאגרי המידע בבית התפוצות : הערכה בשנית


במשך 30 שנה צבר בית התפוצות אוצר של ידע מפתיע, נדיר ומסקרן: מעל 5 מיליון איש בעצי משפחה, מאות אלפי צילומים וסרטים, קבצי מוזיקה יהודית מהעבר וההווה, פירושים ומקורות של עשרות אלפי שמות משפחה, ומידע על אלפי קהילות יהודיות ברחבי הגלובוס. ובקיצור, כל מה שמרכיב את הסיפור של העם היהודי.
כמי שעבד בזמנו כמידען במכון שילוח באוניברסיטת תל אביב , אני זוכר כי בית התפוצות היו בשנת 1979 החלוצים האמיתיים של פיתוח מאגרי מידע ממוחשבים בישראל. 
בעזרת חברת  תוכנה בשם 2001 הם הקימו בזמנו מאגר מידע פרמטרי יעיל מאד על מחשב מיני מסוג  PDP . התוכנה לאיתור היסטוריה של שמות משפחה יהודיים היתה בזמנו המתקדמת ביותר בישראל .  במשך שנים היינו צריכים להגיע למחשב המיני של בית התפוצות ולערוך שם את החיפושים המומחשבים.
עברו חלפו עשרות שנים , האינטרנט בכלל וגוגל בפרט הגיעו לחיינו והנה גיליתי לאחרונה כי בית התפוצות ומאגרי המידע ההיסטוריים שלו  כבר לא נשארו מאחור והם במרחק נגיעה!!
הם כעת בעיצומו של מהלך וניסיון לשדרג את כל מערכת מאגרי המידע שלהם לאינטרנט והשדרוג , גם אם עדיין בעבודה נמשכת, הוא בהחלט הפתעה לטובה הן מבחינה מידענית והן מבחינת מימשק  המשתמש (User Interface  או  בקיצור  UI).
הם עובדים על הפרוייקט הזה באינטרנט כבר שלוש שנים והתוצאות מרשימות בהחלט.
איחזור המידע ( חיפוש)
החיפוש הוא מאד אינטואיטיבי וידידותי . ניתן לחפש שם משפחה ולהצליב למקום או מדינה .
מקבלים רשימת תוצאות הניתנות למיון בכמה וכמה ערוצים :
  • מקומות
  • תמונות
  • אנשים ( עצי משפחה)
  • וידאו
  • אישים
  • שמות משפחה

סינון עפ"י שדות
ניתן לבצע סינון נוסף ולהוסיף שדות  כגון :
  • שם פרטי
  • שם משפחה
  • מקום לידה
  • מקום נישואין 
  • שנת לידה

בכל מהלך החיפוש והסינון  במאגרי בית התפוצות  המחודשים ממשק המשתמש נשאר ידידותי , מרווח ואינטואיטיבי למדי.
 חווית המשתמש כאן היא גבוהה ביחס למאגרי מידע היסטוריים דומים בחו"ל ועל כך יבואו על הברכה צוות המיזם המתוקשב הזה בבית התפוצות.
בערך הנבחר במהלך החיפוש מקבלים ערכי נושא קשורים ותוספת זו היא בהחלט מעשירה את המחפש והקורא.
לא רק איחזור מידע אלא גם ניהול מידע
ארכיטקטורת החיפוש וניהול המידע נועדו להקל על המשתמש לשמור פריטי מידע בתת-מאגר משלו הנקרא "הסיפור שלי" .  ניתן להוסיף ולצבור צילומים , מידע על עיירות , משפחות ועוד כהנה וכהנה .
ניתן לצבור בקלות פריטי מידע לדף  מידע שלכם שיצרתם שם בעצמכם וניתן לגשת אליו מכל מחשב ולחזור ולצבור עוד ממצאים שחיפשתם ומצאתם.
הנה דוגמא של "הדף שלי" ( "הסיפור שלי " ) שיצרתי במערכת של אתר באינטרנט של בית התפוצות .