פירות יער, פונקציות אקסל ועתיד הדמוקרטיה

אז מה אני עושה באוקראינה….

בגדול מנסה לשכנע אוקראינים לא להתייאש מדמוקרטיה, בעודי מראה להם כתבות של שאול אמסטרדמסקי על תקציב מדינת ישראל מתורגמות בגוגלטרנסלייט, ומספרת שגם אצלינו אתרים ממשלתיים עובדים באקספלורר והמדינה קונה מעצמה נתוני מזג אוויר.

חנות עודפים של רשתות ביגוד אירופאיות

היום הסתיים המחזור הראשון – 28 עיתונאים (בעיקר עיתונאיות) מכל קצבות אוקראינה עברו חמישה ימים אינטנסיביים של סדנת data-journalism, שכללה משיכת נתוני הוצאות המדינה דרך API מפורטל e-data לאומי, ניקוי ופילטור שלהם ב-OpenRefine, ניתוח וחילוץ סיפורים ב-Google Sheets וויזואליזציה שלהם בגראפים של גוגל וטאבלו. זאת בנוסף לתיאוריה על מידע פתוח ומודלים נפוצים של שחיתות וביזבוז תקציבי. נשמע כמו תוכנית סטנדרטית. עד שמבינים שרובם המוחלט לא עבדו עם אקסל מימיהם, ובמקרה שנדרשו לעבוד עם נתונים הדפיסו את הטבלה הדרושה, מירקרו אותה וסכמו מספרים ידנית. רובם המוחלט גם לא ידעו אנגלית. כשהראנו להם את הפרודיה על ספר הדרכה, עם הכותרת “How to google error messages” בתור הלצה, חלקם התחילו להעתיק את השם שלו מהלוח. היו מי שלא הכירו את הקונספט של undo או איפה לחפש קבצים שהם הורידו מהאינטרנט, או איך לפתוח חשבון גוגל. גרוע מזה, באותה הכיתה ישבו מי שכן ידעו את כל זה והיה צריך לדאוג שגם הם לא ינדדו כל עת לפייסבוק. ושכחתי להגיד שכמובן האינטרנט בחדר ההרצאות נתקע כל רגע (בדיעבד גילינו שכמה מהם הריצו ביטטורנט בלא יודעין), וגם היו להם לפטופים גרוטאות, למי שבכלל היה מחשב. אה, וכל זה באוקראינית. שני המדריכים האחרים שליוו אותי הצהירו שלהם לא נוח ללמד ברוסית (מישהו אמר שלי זה כן נוח?) ולא השאירו מקום לדיון.

עיתונאים אוקראינים מכל קצוות המדינה

אבל בסוף, אחרי חמישה ימים מעניינים“, הם מצאו שבעיר אחת הוציאו ככסף על פרוייקט בינוי שבפועל מעולם לא התחיל, בעיר אחרת ההוצאות על משכורות במחלקת הספורט העירונית היו גבוהות מהכסף שהושקע בספורטאים, ובעיר שלישית מספר חשוד של תושבים עם אותו שם משפחה הופיע במרשם הבעלות על קרקעות.

בשבילי, הרבה יותר קשה מללמד pivot tables היה לעמוד מול עיתונאית שאומרת אבל מה כל זה נותן לנו? אז אנחנו חושפים שחיתויות, כותבים עליהן בעיתון, כל העיר יודעת, בית המשפט אוסף ראיות, אבל אף אחד מעולם לא נכנס לכלא. אצלנו תופסים גנבים כמו שבאמריקה דגים דגים תופסים ומשחררים, תופסים ומשחררים”. ניסיתי לשכנע שככה זה דמוקרטיה, ארוך ומייגע, זרקתי מילים כמו חברה אזרחית“, “חופש הביטוי“, “גם אצלנו“, והלכתי לשתות כוסית של שיכר חוזרר (פרי יער כלשהו) כדי להכיל את היאוש. לקראת סוף הסדנה נמצאה אקטיביסטית אחת צדיקה בסדום, שסיפרה איך בעיר שלה בעקבות מעקב אזרחי בלתי פוסק כבר יש שידורים ישירים מדיוני מועצת העיר, ולא צריך עוד להילחם בנמר בחדר שירותים חשוך כדי לראות את תוכניות הבניה. התרגשתי כל כך ששכנעתי אותה להקליט לי נאום פטריוטי חוצב להבות שבו היא פונה לאחיה האקטיביסטים ומסבירה להם שהשינוי אפשרי. עכשיו יש לי 10 דקות ממנה על הסמארטפון, על רקע העציצים בלובי של פונדק הדרכים שבו שכרו עבורינו כיתת הדרכה. אני עוד לא לגמרי בטוחה מה אעשה עם הוידאו.

אנדריי, איש מידע פתוח

האמת שקייב די מגניבה. יש רכבת תחתית, מיליון בתי קפה היפסטריים, אנשים נחמדים ובלי יותר מדי פוזה, נעלי עקב ומייקאפ שרואים במוסקבה. חופש הביטוי מרשים, שבולט על רקע החוויות שלי מבלרוס, ששם עדיין מדברים על דברים במטבחכמנהג סובייטי עתיק. לא מעט ארגוני חברה אזרחית שיודעים לעשות אחלה עבודה. אפילו חוק חופש המידע עובד לא רע, סיפרה לי עורכת דין אקטיביסטית.

היו לי גם חוויות צבעוניות, כמו למשל סקנדל קולני שהייתי גם עדה לו, שהתפתח בין שתי נוסעות במונית שרות – צעירה שתפסה שני מושבים עם השקיות שלה ודודה שביקשה ממנה לפנות מושב אחד כדי להושיב את ילדיה. הצעירה טענה שאין לה מקום אחר לשים את השקיות ושכל עוד יש גברים שיושבים ברכב היא לא מוכנה לקום ולפנות מקום, לא ככה חינכו אותה. בסוף כשחשה שהיא מפסידה בויכוח היא זרקה אני בכלל בהריון“, אבל הייתי צריכה לרדת ולא הספקתי לגלות איך נגמר. היה מעניין לראות שהדודה דיברה באוקראינית והצעירה ענתה לה ברוסית – ערבוב שגור בקייב.

גם הפרסומות חשפו משהו מהמציאות המקומית – פרסומות ל-Uber עם התייחסות סמויה לאיסור האחרון של הנשיא על שימוש ברשתות חברתיות, פורטלים וערוצי טלוויזיה פופולרים ממקור רוסי.

מתגעגע לעשות לייקים (ברשת Vkontakte)? תן 5 כוכבים לנהג שלך בסוף הנסיעה.”

פרסומת ל-Uber

אנדריי הוא עסקן מידע פתוח בסטנדרט בינלאומי. בין היתר הוא מעביר הדרכות למדריכים, שבתורם מיועדים להדריך פקידים בשלטון המקומי על יישום החוקים המקומיים להנגשת מאגרי מידע. מצב המידע הפתוח לא פשוט. אוקראינה משתרעת על פני 25 מחוזות ומונה 42.5 מיליון תושבים. פתיחת המידע החיוני ביותר לחיי היומיום של התושבים מתבצעת ברמה המקומית. חלק מהערים מנגישות כבר לא מעט, ולחלק אין אפילו אתר. בשנה האחרונה אוקראינה עלתה מאוד במדד הפתיחות של Open Knowledge, בעיקר בזכות מערכת הרכש Prozorro בה מדווחות הוצאות עד ה-Hryvne האחרון. אפשר לראות גם טראנסאקציות של 0.01 הריבנה. הנשיא אפילו צייץ על הציון של מדינתו במדד בטוויטר שלו. מצד שני, התקציב עצמו מתפרסם ברזולוציה מגוחכת. לשם השוואה, בקובץ התקציב שמפרסם אגף התקציב אצלינו יש כ-336,000 שורות, לעומת סדר גודל של 150 שורות בתקציב אוקראינה. יתרה מכך אין שום מזהה ייחודי, כגון מספר תקנה תקציבית, שמאפשר לקשר בין נתוני התקציב לנתוני ההוצאות כדי לדעת כמה כסף יצא מכל סעיף. העיתונות החוקרת האוקראנית, שרובה ממומנת מתרומות אירופאיות, עסוקה בעיקר בהצלבת הצהרות הון ורכוש של הפוליטיקאים עם רישומי טאבו, נתוני רשם החברות ורשימת הספקים המופיעים בדוחות הרכש. הייתם חושבים ש-25 שנה אחרי התפרקות ברהמ כבר יסיימו לחלק ולבזוז את אדמות המדינה והנכסים הציבוריים. אבל מסתבר שלא נגמר מה לגנוב אף פעם. בביקורת הדרכונים בשדה התעופה של קייב, על הדלפק של שוטר הגבול תלוי שלט ב-10 שפות שכתוב בו משהו בסגנון באוקראינה אין שחיתות, אל תנסו לשחד את השוטר שלפניכם” (השוטר לא הסכים שאצלם את הכיתוב). תודה שסיפרתם, עכשיו אני יודעת.

דוכן מכירה של ספינרים

אנדריי סיפר לי שבחממת מידע פתוח החדשה שקמה בקייב, רוב הסטארטפים בכלל לא עובדים עם מידע ממשלתי, כי אין. למשל נתוני מזג אוויר לא פתוחים כי המרכז המטאורולוגי הלאומי מוכר אותם לחברות פרטיות. נתוני מערכת הבריאות, בדומה למה שראיתי בבלרוס ובקזחסטן, לא אמינים במיוחד ולא אחת מותאמים למדדים בינלאומיים. גם חברת הרכבות הממשלתית לא מפרסמת נתונים פשוט כי לא בא לה. משרד התחבורה לא מעיז לעמוד מולה בבית המשפט, כי איכשהו כולם יודעים שהוא לא יוכל על סוללת עורכי הדין של הרכבת. לא פלא. כשמערכת העיתון שבה עובדים המדריכים, הצליחה לקבל מאגר אנונימי ענק של כל הכרטיסים שמכרה הרכבת בכמה שנים אחרונות, הם מצאו להפתעתם שנמכרו אלפי כרטיסים לתחנות שרות שבכלל אי אפשר לרדת בהן. הסיפור המטורף הזה מתואר בכתבה מפורטת באתר שלהם, שגם תורגמה לאנגלית. מישהו התרגש מהממצאים? אולי התורם של העיתון, כנראה שלא השלטון.

texty-yanukovych-trains

אומרים לי שהמאכזבת ביותר היא המערכת המשפטית. גם כשעוצרים מישהו עם שפע ראיות נגדו, זה בדרך כלל לא מוביל להרשעה. השופטים פשוט לא עצמאיים ומחוברים לשלטון, במיוחד בעיירות קטנות.

להיות חייל שכיר, מה שהלב אומר לך

באתי ללמד ויצאתי מלומדת. לשורה ארוכה של מודלים לשחיתות וביזבוז כספי ציבור נוספו עוד כמה דוגמאות מקומיות ייחודיות: כדי להסתיר ריבוי התקשרויות עם אותה חברה, מחליפים אות אחת או שתיים בשם שלה באות זהה הכתובה באב לטיני (א”ב קירילי חולק לא מעט אותיות עם א”ב לטיני, למשל T, A, M, C, K אבל ה-encoding שלהם שונה), מה שמונע משם החברה לעלות בתוצאות חיפוש; מוכרים סחורה במחירים מופקעים – למשל אותה האקטיבסטית מצאה רכש של עצי אשוח לשיפור פני העיר, וכאשר התקשרה לחברה לשאול מה מחיר הסחורה, הם נקבו במחיר נמוך פי שלושה. בעקבות החשיפה הרכש בוטל. ”אצלינו, יותר קל לגנוב במכולות מאשר בשקיםאמרו לי. גם אצלינו.

תה תותים טריים

מחר מתחיל המחזור השני של ההדרכה. חוויות חדשות בקרוב…

פרק 6 – הסדנא בשיחה – עם גיל יעקב מנכ”ל 15 דקות שמקדם את נושא התחבורה הציבורית בישראל

שוחחנו עם גיל יעקב מנכ”ל 15 דקות שמקדם את התחבורה הציבורית בישראל. ממנו למדנו למה האוטובוס יוצא מתחנת הרכבת לפני שהרכבת מגיעה. למדנו גם שאפשר לשנות את המצב. חשוב להתלונן כאן, ואפשר וגם רצוי ליזום תחנות חדשות וקווים חדשים, או כל דבר שישפר את השרות, ארגון 15 דקות ילווה אתכם ותוכלו יחד לגרום לשינוי לטובה.

דברנו גם על יוזמות אוטובוסי השבת כמו נוע תנוע שמפעילה שלושה קווי אוטובוס בשבת בגוש דן (תכף ארבעה), על שבוס שמפעילה קווי אוטובוס בשבת בירושלים ובמרכז. ועל יוזמות חשובות נוספות כמו שימוש ברב קו במוניות שרות, נתיבי תחבורה ציבורית, וקווי אוטובוס בתל אביב במסלולי הרכבת הקלה כאן ועכשיו. הזכרנו כמובן גם את פרוייקט תחבורה ציבורית פתוחה שהוא פרוייקט בבניה של הסדנא שמנתח מידע זמן אמת על הגעות של אוטובוסים לתחנות.

לקינוח הזכרנו סיפור קצר ומקסים של אתגר קרת שתוכלו לקרוא באוטובוס על נהג האוטובוס שרצה להיות אלוהים

פרק 5 – הסדנא בשיחה – דברנו עם תומר אביטל אביר השקיפות ומיוזמי קרן התחקירים העצמאית

דברנו עם תומר אביטל על שקיפות בממשל ובכנסת, על מיזם 100 ימים של שקיפות, על השקיפות בממשלה שמחזיקה אתר בשם המעטפה, אליו שרים מעלים הצעות להחלטה, שהופכות להחלטות ממשלה תקפות תוך שבועיים אם לא הובעה התנגדות. האתר נפתח לציבור בזכות פועלו של תומר יחד עם עוד לוחמי שקיפות. למדנו גם על הבג”ץ שהוגש על ידי המיזם לפתוח את דיוני ועדת השרים לחקיקה (שהיא המקום בו ההחלטות לגבי החיים שלנו קורות בפועל) לציבור, אנחנו מחזיקים אצבעות. הכרנו את מיזם קרן התחקירים העצמאית שמאפשרת לציבור לבחור את נושאי התחקירים, ולעיתונאים לעבוד למען הציבור באפן בלתי תלוי. הזכרנו גם את חוק חופש המידע, שמאפשר לכם לדרוש מהממשל את המידע ששייך לכם  ואת לובי 99 שמעסיק לוביסטים בכנסת בכדי לייצג את הציבור. סיימנו בתוכנית לארועי הקיץ עם הרצאות ברחבי הארץ בנושאים בוערים מתניעים את הדמוקרטיה, ועוד מלא דברים מרתקים

פרק 4 – הסדנא בשיחה – עם מרי לויצקר על האקתון קיץ בסדנא, פרוייקטים חדשים והפתעות

מרי לויצקר רכזת המתנדבים של הסדנא לידע ציבורי מעדכנת אודות

האקתון קיץ בסדנא בחמישי-שישי-שבת ה-8-9-10 ביוני

מפגש הכרות למתנדבים חדשים ביום שישי 9 ביוני בשעה 10:00

ופרוייקטים חדשים בסדנא

פרק 3 – הסדנא בשיחה – עם אלון אנטין שמנסה להגן עלינו מהמנופים הנופלים

דברנו עם אלון אנטין פעיל הסדנא והליכודניקים החדשים על המוטו של “לדעת להשפיע”. על הרצון העז שלו להשפיע על המציאות שסביבנו, הוא ספר על נתיב ההשפעה שלו על הליכודניקים החדשים על הכח המצטבר שלהם בליכוד (10000 קולות!), ועל החוקים שעברו בזכותם

דברנו גם על קבוצת תאונות הבניה והאתר שהוא מקים שבעזרתו תדעו אם למנוף ליד הבית שלכם יש רשיון בטיחות, או שהוא עלול ליפול עליכם או על משפחתכם בכל רגע. אתם בהחלט מוזמנים להביט במפה למצוא את המנופים הקרובים לביתכם ולבדוק עם הקבלן והעירייה האם יש למנוף לידכם רשיון בטיחות. אלון ישמח לקבל מכם את המידע אודות רשיון המנוף בפייסבוק ולהוסיף אותו למפת המנופים

האתר של הליכודניקים החדשים, אג’נדה ושאלות ותשובותהקבוצה למאבק בתאונות בנייןהמפה הזמנית של תקינות מנופי העגורן בארץ – אתם מוזמנים לבדוק עם הקבלן והעירייה האם יש למנוף ליד הבית שלכם רשיון בטיחות, בקשת חופש המידע אודות רשיונות המנופים

פרק 2 – הסדנא בשיחה – עם מי-טל גרייבר שוורץ הלוחמת למען חופש האינטרנט

דברנו עם מי-טל גרייבר שוורץ  סמנכלית ב- איגוד האינטרנט הישראל על המאבק בשש(!) הצעות חוק המאיימות על חופש האינטרנט, על הדרכים בהם אתם יכולים לסייע במאבק החשוב הזה על אופיו הדמוקרטי של האינטרנט ובכך על אופיה הדמוקרטי של המדינה, תוך שמירה על סביבת גלישה בטוחה ככל האפשר לילדים

הזכרנו גם את הרצאתו המרתקת של סנודן בפייסבוק המזהיר מפני הידע הרב הנאגר אודותינו בעקבות חוקים כאלה אצל ספקי האינטרנט, והיכול להפרץ בקלות

ועוד

 

פרק 1 – עם עידן ארץ ממקימי תנועת “חופש לכולנו” על תאוריית הבחירה הציבורית

הסדנא בשיחה

ברוכים הבאים לפודקאסט החדש של הסדנא!

אנחנו – סימונה הולשטיין ומרי לויצקר – נארח כאן אנשים מעניינים שעושים דברים מגניבים וחשובים, ונשוחח איתם על מה שמלהיב אותנו (ואנחנו יודעות שגם אתכם ) – מידע, קוד פתוח, שקיפות ועוד המון

אנחנו רק מתחילות אז אתם מוזמנים להגיב ולהעיר, להרשם לעדכונים, לפרגן ולשתף

אז קבלו:

פרק 1 – עם עידן ארץ ממקימי תנועת “חופש לכולנו” על תאוריית הבחירה הציבורית

דברנו עם עידן ארץ ממקימי תנועת חופש לכולנו על ליברליזם בכלל ועל ליברליזם כלכלי בפרט ולמדנו על תאוריית הבחירה הציבורית. בנוסף דברנו גם על

האסכולה האוסטרית בכלכלה

חפש לכולנו – קבוצת הדיונים בפייסבוק

מילטון פרידמן, ודיוויד פרידמן

הסדנא לידע ציבורי

…ועוד

 

פרויקטור/ית ל- Open GLAM Accelerator

על הפרויקט:

“תרבות פתוחה” הוא פרויקט חדש של הסדנא לידע ציבורי, המבוסס על עקרונות תנועת Open GLAM (Galleries, Library, Archives, Museums) העולמית. מטרת הפרויקט לחבר בין גופים המחזיקים במאגרים תרבותיים, אמנותיים והיסטוריים בישראל לבין אקטיביסטים טכנולוגיים, על מנת לפתוח, להנגיש ולשתף את הציבור באוצרות המצויים בידי גופים אלה.

ראו גם: openglam.org/principles

המסגרת המארגנת של הפרויקט היא תוכנית הכשרה שמיועדת לעובדים בגופים המחזיקים במידע יחד עם מפתחים מעולם ההייטק, אשר תנחיל את עקרונות המידע הפתוח, תאפשר להתנסות בפרקטיקות פתיחת מידע, ותכשיר מפתחים לפיתוח אפליקציות קוד פתוח המבוססות על המידע שנפתח. בלב הפרויקט מודל ייחודי שפותח על ידי הסדנא ונוסה בהצלחה עם הספרייה הלאומית, אשר מבוסס על למידה באמצעות עשייה (learning by doing), ותוצריו הם מוצרים טכנולוגים אשר עושים שימוש במידע שנפתח ומהווים בסיס לפיתוחים עתידיים.

 

על הסדנא לידע ציבורי:

הסדנא לידע ציבורי, ע”ר פועלת לקידום שקיפות ואחריותיות ממשלתית ועידוד שיח אזרחי מבוסס מידע, באמצעות פיתוח כלים טכנולוגיים לפתיחה והנגשה של מידע ציבורי. פעילות העמותה מבוססת על עבודה של מתנדבים מתחום תוכנה, כלכלה, מדיניות ציבורית, עיתונות, עיצוב גרפי ועוד שמובילים מעל ל- 15 פרויקטי מידע פתוח שונים. לרשימת הפרויקטים המלאה: http://www.hasadna.org.il/projects

 

על התפקיד:

  • תכלול הגורמים השונים המעורבים בפיתוח וביצוע הפרויקט;
  • גיוס משתתפים לתוכנית מבין גופי תרבות, מוזיאונים, ארכיונים וספריות;
  • כתיבת חומרים שיווקים;
  • תיעוד ודיווח באתר הפרויקט על כל שלבי הפרויקט ותוצריו;
  • ארגון מפגשי ההכשרה, לרבות גיוס מרצים אורחים;
  • תיאום בין השותפים בפרויקט ובינם לבין משתתפי התוכנית.

 

היקף: תשלום לפי שעות כפרילנס, כ 40 שעות בחודש בממוצע.

 

מקום: במשרדי העמותה במרכז תל אביב וכן פגישות בגופים המשתתפים בפרויקט ברחבי הארץ.

 

תקופה: מאי 2017- מרץ 2018

 

מה אנחנו מחפשים?

  • הכרות טובה עם עולם גופי GLAM בישראל;
  • כישורים בין אישיים מצוינים;
  • ניסיון בהובלה של פרויקטים וכושר ארגון מעולה;
  • אוריינטציה טכנולוגית.

 

איך פונים?

נא לשלוח קורות חיים עד 19.04.2017 בליווי מכתב המסביר מדוע את/ה מעוני/ת בתפקיד אל openglam@hasadna.org.il.

 

*לצערנו לא נוכל להשיב לכל הפניות. רק פניות מתאימות תענינה.

דרושה מנהלת מוצר (Product Manager)

אתר מפתח התקציב חושף את תקציב המדינה לציבור. באתר ניתן לעקוב לא רק אחרי התקציב השנתי אלא גם אחרי השינויים בו לאורך השנה דרך העברות תקציביות. כמו כן האתר חושף גם לאן הולך הכסף דרך התמיכות הממשלתיות והרכש הממשלתי. לאתר ממשק נתונים ומערכת שאילתות רבת עוצמה המאפשרת חיתוכים נרחבים על כל נתוני האתר. בשנים האחרונות התרחבה השפעתו של מפתח התקציב על השיח הכלכלי בישראל ואף על תהליך בניית התקציב עצמו. בין משתמשיו הקבועים נמנים עיתונאים מובילים, אנשי עמותות, פעילים חברתיים, חוקרים וגם כמה וכמה חברי כנסת.

אנחנו מפתחות בימים אלה את הגרסה הבאה של מפתח התקציב ומחפשות מנהלת מוצר שתוביל אותנו בתהליך יצירת מוצר שימושי שעושה אימפקט בעולם.

למועמדות שאינן מתנדבות כיום בסדנא מומלץ להגיע למפגש פיתוח ולהתרשם מאופי העבודה והאנשים. מפגשי הפיתוח השבועיים מתקיימים בקמפוס TLV של גוגל בכל שבוע בימי שני מ-19:00 ועד השעות הקטנות של הלילה.

 

משימות

  • ריכוז העבודה מול design partners
  • שימוש בכלי analytics לניתוח דפוסי שימוש
  • פיתוח מסמכי אפיון (תרחישי שימוש, שלדי אתר, פיצ’רים, מסמכי spec)
  • התאמה בין צרכי המשתמשים לבין משימות הפיתוח
  • תיאום בין stakeholders בפרויקט
  • ניהול ה- roadmap של הפרויקט

מאפייני התפקיד

  • עבודה בסביבת קוד פתוח
  • עבודה עם מתנדבים ופרילנסרים
  • עבודה מסודרת, מתועדת

דרישות

  • היכרות עם פעילות הסדנא והזדהות עם מטרותיה
  • ניסיון  של שנתיים לפחות בתפקיד מנהל/ת מוצר או תפקיד מקביל
  • יחסי אנוש מצוינים
  • הצגת דוגמאות של מוצרים קודמים ותיאור תפקידך בהפקתם
  • ניסיון במתודולוגיות פיתוח קוד פתוח – יתרון
  • תואר רלבנטי (מדעי המחשב, תעשייה וניהול, מדעים) – יתרון
  • ניסיון בעבודה עם מתנדבים – יתרון
  • הכרות טובה עם פרויקט  “מפתח התקציב” – יתרון

היקף, שעות

  • העבודה לפי שעות (פרילנס).
  • 20-30 שעות בממוצע בחודש, החל מחודש מרץ למשך 12-15 חודשים.

 

קו”ח  יש לשלוח  אל cfp@hasadna.org.il.  עד ליום 07.03.2017. נא לציין בנושא “מנהל/ת מוצר למפתח התקציב”

סטנדרטים למידע פתוח לרשויות ציבוריות

המסמך המקורי – פברואר 2017

 

רקע

בעקבות החלטת הממשלה 1933 שקובעת כי מידע ציבורי שברשות גופי ממשל יהיה פתוח כברירת מחדל, הסדנא לידע ציבורי מגישה רשימת המלצות לקראת ניסוח הנחיות לממונים על פתיחת המאגרים במשרדי הממשלה. מסמך זה מתבסס על הנחיות של ממשלות המובילות בפתיחת מידע וארגונים בינלאומיים המרכזים את הידע והניסיון העולמיים בתחום.

 

רשימת מקורות

מדריכים, הנחיות ומסמכי מדיניות של גופים בין-לאומיים ששימשו כבסיס ידע בהכנת מסמך זה.

 

Data on the Web Best Practices

W3C, Dec 2016

זהו המדריך המקיף, והמומלץ ביותר

 

פתוח כברירת מחדל

יש להתייחס לכל מידע שמיוצר, נאסף ומעובד על ידי המשרד כמאגר, שיש לתת את הדעת על ההנגשה שלו. יש להימנע ככל האפשר משמירת מידע מקומית על המחשב האישי, להקפיד על תיעוד המידע בעת איסופו, ולהתייחס כל העת לצרכי המשתמשת.

איסוף מידע ממשלתי ממומן מכספי הציבור, אי לכך הציבור הוא בעליו. גם כאשר ספק שרותים חיצונים נשכר על מנת לנהל את המידע אסור שהדבר יפגע ברמת הפתיחות והנגישות שלו. נקודת המוצא היא כי כל מידע המיוצר או נאסף על ידי גורם ממשל, פתוח כברירת מחדל, אלא אם כן הובא טיעון מספק בהתאם לסייגים המובאים בהחלטת הממשלה, כגון הגנה על פרטיות ובטחון המדינה, מדוע אין לפתוח אותו.

לכלול הנגשת מאגרים בתכנית העבודה ובתקציב המשרד

 

רשימת מאגרים

יש לייצר רשימה של כל המאגרים שהמשרד מייצר, ולפרסם גם אותה לציבור.

 

לוח זמנים לפרסום ועדכון מאגרים

יש לקבוע לו”ז לפרסום ועדכון של כל מאגר ולפרסם אותו לציבור.

 

מינוי ממונה על הנגשת מידע

הממונה יהיה אחראי על עמידה בלו”ז, ביצוע תכנית העבודה והעברת הדרכות על מידע פתוח לעובדי המשרד.

 

שיתוף ציבור

  1. עריכת התייעצות עם החברה האזרחית והמגזר העסקי על מנת לזהות סוגי נתונים שיש בהם עניין למשתמשים.
  2. לאפשר פידבק מהמשתמשים לגבי איכות המידע שפורסם, בקשות לפרסום מידע חסר ובקשות לעדכון מידע שהתיישן.
  3. עבור כל מאגר לציין את הגורם האחראי לאיסוף הנתונים ודרכי יצירת קשר עימו.

 

במידה ובמהלך השנה הוגשו בקשה/בקשות חופש מידע שנסתיימו בשחרור מידע לציבור, יש להעמיד את התוצר שלהן לרשות כלל הציבור באותה מסגרת של רשימת מאגרים, גם אם פתיחת המידע היתה חד פעמית.

עקרונות מידע פתוח

רשימת העקרונות הבאה נועדה להבטיח נגישות ושימושיות מירביות למידע המשוחרר. זאת כדי שההשקעה של משרדי ממשלה לפרסם מידע תביא את מירב התועלת לציבור.

 

רישיון פתוח

 

על מנת לאפשר ולעודד שימוש במידע ממשלתי יש לפרסם יחד עם המידע רישיון המגדיר את תנאי השימוש, השינוי וההפצה שלו.

לפי ה-Open Definition 2.1, על מנת שמידע יחשב כפתוח עליו להיות נחלת הכלל (public domain), כלומר שלא יחולו עליו זכויות יוצרים או הגבלות דומות. לחילופין הוא יכול להיות מופץ תחת רשיון שיבטיח:

  1. שימוש חופשי במידע
  2. הפצה חופשית של המידע, כולל מכירה
  3. שינוי המידע, כך שעל המידע החדש יחול הרשיון המקורי
  4. כל זאת ללא תלות במטרת השימוש במידע
  5. הפרדה – כל חלק מהמידע ניתן לשימוש, הפצה ושינוי חופשיים בנפרד או בצרופים שונים
  6. צרוף – המידע יכול להיות מופץ בצירוף למידע אחר בלי שהוא יגביל את תנאי הרשיון של המידע האחר.
  7. אי-הפליה – הרשיון לא יפלה נגד אף אדם או קבוצה
  8. רישיון מדבק – תנאי הרשיון יחולו על כל אדם אליו מופץ המידע, ללא הצורך להסכם משפטי נוסף
  9. רב-תכליתיות – הרשיון לא יגביל את השימוש, ההפצה או השינוי
  10. ללא עלות – תוקפו של הרשיון לא יותנה בתשלום כלשהו

 

מומלץ להשתמש ברשיונות סטנדרטיים ומוכרים של Creative Commons כגון CC0 או CC-BY. יש לפרסם את הרישיון יחד עם המאגר.

 

ללא הרשמה

הגישה למאגר תהיה ישירה ללא צורך בהרשמה.

 

פורמט קריא-מכונה

כדי שניתן יהיה להשתמש במידע, חשוב לשחרר אותו בפורמט הניתן לעיבוד וניתוח אוטומטי על ידי מחשב.

 

פורמטים מומלצים

  • מידע טקסטואלי – HTML או Markdown
  • מידע טבלאי (במבנה קבוע) – CSV או אקסל עם גליון אחד בלבד. בכל מקרה, הטבלה תכיל שורת כותרת אחת בלבד ותתחיל מהשורה הראשונה ומהעמודה הראשונה. לכל טבלה תצורף סכמה המתארת את העמודות בטבלה.
  • מידע לא טבלאי – XML, JSON. בצרוף סכימה מתאימה.
  • מידע גיאוגרפי – GeoJSON או Shapefile עם הגדרת ההיטל שלו.

 

הבהרות

  • גם כשהפורמט קריא-מכונה, הוא עדין צריך להישאר קריא עבור בני אדם. תנו שמות מפורשים לשדות ולעמודות.
  • קובצי תמונה, TIFF או pdf שנוצר מסריקה של מסמך אינם קריאי-מכונה – לא ניתן לקרוא מהם את הנתונים בצורה ממוחשבת. פיענוחם מצריך עבודה ידנית של הקלדת הנתונים.
  • קבצי doc ו- pdf שנוצר מתוך doc אמנם עדיפים על פני טקסט סרוק, מפני שניתן לחפש ולהעתיק מהם קטעי טקסט, אולם הם אינם קריאים על ידי מנועי חיפוש.

דוגמה: אם פרוטוקול של דיון בועדת כנסת מפורסם באתר הוועדה כקובץ doc או pdf, גוגל לא מבצע חיפוש בגוף הטקסט. כך למשל, אם  עורכים חיפוש לפי שמות של נוכחים או נושאי דיון שמופיעים בתוך הטקסט, קובץ הפרוטוקול לא יעלה בתוצאות.

  • קבצי doc אינם קריאי מכונה כי אינם מכילים עיצוב סמנטי. לדוגמא: כאשר לא משתמשים ב-Headers הקבועים, אלא פשוט בטקסט מוגדל ומודגש, זה מאוד מקשה על ניתוח אוטומטי ומצריך שימוש בהיוריסטיקות כדי להבין איפה יש כותרת ואיפה סתם טקסט גדול ומודגש. הדבר גם מקשה על חלוקה נכונה של התוכן לנושאים. בנוסף העיצוב משתנה בין המסמכים ואינו עקבי. כמו כן טבלאות או גרפים המשוייכים למסמך גם הם צריכים להיות בפורמט קריא מכונה, ולא תמונות מודבקת לתוך המסמך.

דוגמה לתוכן סמנטי: כותרת עטופה בתגית שאומרת שזה כותרת <h1>

פסקה שקשורה לכותרת תהיה תחת תגית הכותרת ועטופה בתגית פסקה: <h1><p>blabla</p</h1>

לחילופין, ב-Markdown טקסט סמנטי נראה כך: **מודגש**, *מוטה* , _קו תחתי_ , “# כותרת”.

  • קובץ חתום שמצריך הפעלה ידנית של תוכנה לפתיחתו, לא ניתן למשוך ולפתוח אותו אוטומטית. למשל נתוני הפטור ממכרז המתפרסמים בפורטל מנהל הרכש הממשלתי.
  • קבצי תמונה או אריחים (tiles) של מפות שנוצרו על ידי סריקה או שמירה כ- raster של מידע גאוגרפי ווקטורי אינם קריאי מכונה.

 

פורמט מקורי

ככלל יש עדיפות לפורמט שבו המידע נוצר במקור. אם זו טבלה שנוצרה ב-Excel, אל תמירו אותה ל-doc או pdf. אם זה טקסט שהוקלד ב-Word, אל תמירו אותו ל-pdf. אך אם התבצעה המרה לפורמט נגיש יותר, כמו זיהוי טקסט במסמך או דיגיטציה של מפה, יש לפרסם גם את תוצאות ההמרה.

 

מגוון פורמטים

כדאי לפרסם את אותו המאגר בכמה שיותר פורמטים שונים כדי שיתאים לכמה שיותר שימושים.

 

פורמט לא קניני

מומלץ להימנע מפורמטים המצריכים רכישה של תוכנה מסחרית על מנת לקרוא אותם. כך למשל, השימוש בתוכנות Microsoft כגון Excel או Word נפוץ מאוד בישראל, אך אלה תוכנות בתשלום. משתמשים רבים של מערכות הפעלה ממשפחת Linux (שאינן Windows), במיוחד בקרב מומחי תוכנה, לא עובדים איתן. ניתן לפרסם בפורמט קנייני, כל עוד לצדו מתפרסם פורמט לא קנייני.

 

עקביות הפורמט

חשוב שהמבנה שנבחר יהיה קבוע. המשתמשים שמפתחים מערכת המושכת ומעבדת את המידע, מתאימים אותה לפורמט המדוייק של הקבצים. אם מבנה השדות בטבלה, או סדר הטקסט משתנים המערכת תצא מכלל שימוש.

 

סטנדרטיזציה

המאגרים צריכים להיות בפורמטים סטנדרטיים כדי לאפשר השוואה ביניהם. כמו כן חשוב להקפיד על תאימות לסטנדרטים בינלאומיים.

דוגמה: על אף שמשרד הפנים הגדיר סטנדרט למבנה של תקציב רשויות מקומיות, מרבית הרשויות אינן נצמדות אליו ומספררות באופן שונה את הסעיפים התקציביים. כתוצאה מכך, לא ניתן להשוות בין התקציבים ללא עבודה ידנית סיזיפית של המרתם למבנה אחיד.

 

רמת פירוט

מומלץ לפרסם את המאגר ברמת הפירוט / רזולוציה (granularity) הגבוהה ביותר שקיימת.

במידת האפשר יש לפלח את המידע לפי מגדר, רמת הכנסה, גיל וקטגוריות אחרות.

 

מידע מעודכן אקטואלי ועקבי

 

מידע שלם ואיכותי

יש לוודא כי מירב השדות במאגר מלאים, ולהמנע במידת האפשר לסווג נתונים כ”אחר”, “שונות”, “רגיש” וכו’.

 

מידע נקי

יש לערוך בדיקות איכות תקופתיות כדי לוודא שאין שגיאות הקלדה.

דוגמה 1: בעבר היו קיימות תקנות בתקציב המדינה שהוקלדו באותיות לועזיות כאשר מי שהזין אותן לא הפך את המקלדת לעברית והקליד ג’יבריש.

דוגמה 2: בנתוני מינהל הרכש הממשלתי, לעיתים מי שמילא את הפטור במערכת, הזין במקום ההיקף הכספי את מספר הח”פ של הספק. זה גורם לכך שנוספים 500-600 מיליון ש”ח לספקים ומשרדים.

 

מידע גולמי

מומלץ לפרסם את המידע כפי שהוא מיוצר, במצבו הראשוני ביותר והלא מעובד. יחד עם זאת אם קיימים עיבודים של המידע, כגון אגרגציות, ויזואליזציות וכו’, ניתן לפרסם גם אותם, בליווי הסברים של תהליך החישוב.

דוגמה: נתוני נסיעה של תחבורה ציבורית – עדיף לפרסם מידע גולמי כפי שהוא משודר ממכשירי ה-GPS שבאוטובוסים, הכולל מיקום וזמן הדגימה. ניתן לפרסם גם את החישוב של זמן ההגעה החזוי לתחנה הקרובה, אך בנוסף ולא במקום המידע המקורי.

מערכת שאילתות איננה מידע גולמי. דוגמאות למערכת שאילתות: ממשק הנתונים של המשטרה, מערכת קוים כחולים של מנהל התכנון.

 

מטה-דאטה

זהו אוסף פרמטרים המתארים את המידע, בעלי פורמט קבוע, הנמצאים בראש כל קובץ. מטה דאטה חשוב ממש כמו הדאטה, ובלעדיו קשה מאוד לפענח את תוכן הקובץ. גם המטה דאטה צריך להיות מפורסם כמידע פתוח, וגם עבורו צריך להגדיר את הפורמטים.

מטה-דאטה איכותי יאפשר לקחת קובץ נתונים מפורטל מידע ממשלתי ולטעון אותו לעיבוד אוטומטי בלי לטעות בקריאה של התאריך (dd/mm/yy או mm/dd/yy?), של הנקודה העשרונית (האם היא נקודה או פסיק), בהחלטה אם השפה של הטקסט היא עברית או אנגלית וכו׳. מעבר לכך, זה גם מה שמאפשר לעשות ולידציה אוטומטית לנתונים. זה אומר לבדוק האם כל העמודות מופיעות? האם בכל שדה יש נתון? האם הנתון שאמור להיות מספר או אכן מספר? וכו׳.

 

דוגמה 1: כדי לקבל את דוחות הרכש של משרדי הממשלה יש שליפה במרכב״ה שמייצרת את הקובץ. לכאורה כל הקבצים אמורים להיות באותו פורמט בדיוק, אך בפועל, כל משרד מפרסם קובץ בפורמט אחר ושדות שונים.

בהינתן סכמה מסודרת לקבצים אלה, הבעיה הייתה נמנעת.

 

דוגמה 2: עבור קובץ טקסט של פרוטוקול של דיון בועדת הכנסת, מטה-דאטה מועיל עשוי להכיל את מועד הדיון, שם הוועדה, רשימת המוזמנים, רשימת המשתתפים, רשימת הלוביסטים הנוכחים, נושא הדיון וכו’. חשוב שמבנה זה יהיה אחיד, כדי שהמשתמש יוכל לבנות כלי אוטומטי שיקרא שדות אלה בכל קבצי הפרוטוקולים, דבר שיקל על עיבוד המידע.

 

קיימות מספר רמות של מטה-דאטה:

  1. Descriptive metadata
  2. Structural metadata
  3. Administrative metadata

אחד התקנים הפשוטים והמוצלחים הוא ה-data package שמקודם על ידי ארגון Open Knowledge.

 

סימון גרסאות

כאשר חל שינוי במבנה הנתונים, למשל אם נוספה או נמחקה עמודה בטבלה, יש לציין זאת על ידי הקצאת מספר גרסה חדש, כדי להתריע בפני המשתמשים על העדכון. כמו כן יש לתעד את כל הגרסאות ששוחררו.

 

שימור מידע ישן

 

קישור ישיר למידע

לכל מאגר יהיה URL ייחודי ויציב שניתן להשתמש בו כקישור ישיר למאגר.

דוגמה: מערכת מבא”ת – ממשק לאיתור תכנית של מנהל התכנון במשרד הפנים. בעבר, כאשר המשתמש היה מחפש במערכת תוכנית ספציפית, לתוצאות לא היה URL ייחודי ולא ניתן היה לשתף אותן. בצילומי המסך למטה רואים שתי תוכניות שונות עם אותה כתובת URL.

דוגמה טובה היא אתר מפתח התקציב, שלכל תוצאת חיפוש בו יש URL ייחודי, ובנוסף ניתן להוריד את מקבץ הנתונים הרלוונטי לתוצאה זו. למשל זו הכתובת עבור תקנה מס’ 20.46.04.10 בשם “פעילות התנדבותית למען הקהילה של תלמידי י”א-י”ב”  http://www.obudget.org/#budget/20460410/2016/en?tab=supports

ובצד שמאל, המוקף בעיגול כחול בצילום המסך מטה, ניתן להוריד נתוני ההיסטוריה התקציבית של התקנה, פטורים ממכרזים ותמיכות.

 

קישוריות מידע (interoperability)

כדי לאפשר הצלבה של נתונים ממקורות שונים יש לתת לכל רשומה במאגר מזהה ייחודי וקבוע שיזהה נתון זה במאגרים שונים ברשויות שונות. הדבר נכון גם לגבי פריטי מידע באותו מאגר שיש ביניהם קשר. המזהה יהיה כלול במטה-דאטה.

דוגמה 1: בדו”חות הרכש של המשרדים הספק מזוהה על ידי מספר ספק פנימי, בעוד שבמערכת מנו”ף הספק מזוהה על ידי מספר ח”פ. כך כאשר מנסים להצליב מידע משני המקורות לא ניתן לחבר בין הרשומות של הספקים מכאן ומכאן.

דוגמה 2: באתר הכנסת, המזהה הייחודי של הצעת החוק מלווה את ההצעה רק בצברי הנתונים שקשורים לדיונים בוועדות ובמליאות – המידע שנמצא במערכת ה”סנהדרין”. אולם ההצבעות על ההצעות שמורות במערכת אחרת ועדין לא ניתן לקשר בין דיון בהצעה להצבעה עליה. המספר הרשמי שמסמן את ההצעה ברשומות הכנסת, ניתן לה רק בשלבי חקיקה מתקדמים, לעיתים מספר הצעות מתמזגות ומקבלות את המספר של אחת מהן. גם הכותרת עשויה להשתנות. למשל הצעת חוק ייצוג הולם של יהודים בני המגזר החרדי בשירות הציבורי

בעת אישורה הפכה ל חוק ייצוג הולם של בני האוכלוסייה החרדית ושל עולים חדשים בשירות הציבורי

או הצעה שבקריאה הטרומית נקראה: הצעת חוק לתיקון פקודת מסי העיריה ומסי הממשלה (פטורין) (פטור מארנונה לארכיון ציבורי), התשע”ו-2015

ובקריאה הראשונה נקראה: הצעת חוק לתיקון פקודת מסי העירייה ומסי הממשלה (פטורין) (מס` 27), התשע”ז-2016

אין דרך לדעת שמדובר באותה הצ”ח מאחר ויש לפחות 27 תיקונים שונים לפקודת מסי העירייה והממשלה. לכן יש קושי לעשות אגרגציה של כל פריטי המידע הקשורים להצעה מסויימת. להסבר מפורט

דוגמה 3: בדו”חות של הגופים המוסדיים המפרטים את אחזקותיהם בניירות ערך, שם המנייה של אותה חברה יכול להיכתב בשלל דרכים שונות, למשל 32 השמות של חברת טבע:

 

דברי הסבר

להוסיף הסברים לעמודות ושורות של טבלאות, למבנה המידע, המקור שלו, אופן הפקתו וכו’. כמו כן לציין סוגיות ידועות הקשורות באיכות המידע. למשל מידע שהאיסוף שלו לא התחיל בתחילת השנה הקלנדרית, מאגר שחסרים בו נתונים וכו’.

דוגמה 1: למשרד התחבורה ידוע כי נתונים שהוא מפרסם אודות זמן הגעה חזוי של אוטובוס לתחנה אינם משקללים עומסי תנועה. יש לציין זאת במפורש.

דוגמה 2: הוגשה בקשת מידע לרכבת ישראל עבור מספר הנוסעים הנכנסים ויוצאים מתחנות. המידע שהתקבל הכיל מספרים לא שלמים של נוסעים כמו גם נוסעים שנסעו ביום שבת. במקרה זה ללא הסבר לאופן הפקת המידע לא ניתן לעשות בו שימוש.

רצוי שגם קבצי ההסבר יהיו בפורמט קריא מכונה.

דוגמה 3: נתונים שאוספת הלמ”ס אודות תאונות דרכים מגיעים מדיווחים של המשטרה מזירות של תאונות דרכים. נתונים אלה שונים מהנתונים שנאספים בבתי חולים שקולטים נפגעי תאונות. לכן חשוב לציין את מקור הנתונים ואופן האיסוף שלהם.

 

הורדה מרוכזת (bulk download)

כדי להקל על המשתמשים להוריד את המידע, כדאי לאפשר הורדה של כל הקבצים במאגר כמקשה אחת, אם על ידי ריכוז כל הנתונים בקובץ אחד, ואם על ידי כיווץ מספר קבצים יחד כ-zip או כ-rar.

דוגמה 1: פיזור של תחנות משטרה – קובץ שיכיל את מיקומי התחנות בכל הארץ במקום קובץ נפרד לכל רשות מקומית או מרחב.

דוגמה 2: תקציב המדינה – קובץ אחד שיכלול את תקציבי כל המשרדים, כולל התכנון, השינויים והביצוע. זאת במקום קבצים נפרדים לכל משרד, וביצוע בנפרד מהתכנון.

 

ממשק מפתחים – API

API מאפשר למשתמש למשוך מתוך מכלול גדול של נתונים רק את החלק שדרוש לו.

למשל, מאגר נתוני מזג אוויר מורכב מישובים רבים ומתעדכן בתדירות גבוהה. כדאי לבנות API שיאפשר למשוך נתונים לפי ישוב. כך גם בנתוני תחבורה ציבורית כדאי לאפשר באמצעות API למשוך רק נתונים של תחנה מסויימת בישוב מסויים בשעה מסויימת. דוגמה אחרת היא קטלוג של הספריה הלאומית שמכיל ערכים רבים. כדאי לאפשר למשוך רק את רשימת הערכים שהתעדכנו (נוספו או נמחקו) בתקופה נתונה.

 

כאשר קיים API, יש לספק לו תיעוד.

שחרור מאגר נתונים שלם – data dump

יש לאפשר הורדה של המאגר במלואו ולא להסתפק במתן גישה לכל נתון בנפרד.

למשל, באתר התמיכות הממשלתי לא ניתן למשוך את כל מאגר נתוני התמיכות בשלמותו, אלא רק לחפש בכל פעם נתון בודד דרך ממשק השאילתות

http://www.tmichot.gov.il/irj/portal/anonymous?guest_user=awf_user

http://www.tmichot.gov.il/ibi_apps/WFServlet?IBIF_ex=suppe_portal_notif_item_all6

 

הבטחת איכות

מידע יכול לעמוד בכל הקריטריונים שתוארו לעיל ועדיין להיות שגוי או חסר. לכן, כיום אנו רואים תשומת לב הולכת וגוברת לאיכות המידע שנפתח ומתפתחים כלים אוטומטיים הבודקים את שלמות ואיכות המאגרים.

דוגמה: אתר  Spendex של הסדנא לידע ציבורי הוא דוגמא להטמעה של כלי כזה לביצוע בדיקה שגרתית לאיכות הנתונים בדו”חות הרכש הממשלתיים.

מאחר וחלק מהגופים מיאנו לפרסם את דו״חותיהם באופן סדיר, חרגו מהמבנה הסטנדרטי שנקבע לדו”ח, פרסמו מידע חלקי, שגוי או לא מפורט מספיק, פותח מדד “איכות נתוני רכש”. המדד משקלל את הקריטריונים הבאים.

 

  1. שם ספק מצויין בצורה תקינה
  2. הדו״ח פורסם במועד הקבוע בנוהל
  3. היקף ההתקשרות מצויין
  4. הקישור למערכת מנו״ף תקין (רלוונטי במקרה של מכרז או פטור ממכרז, למעט פטור בעילה של סכום הנמוך מ-50,000 ש”ח)
  5. מועד ההזמנה מצויין בצורה תקינה
  6. אופן ביצוע הרכישה מצוין (ולא ריק או ׳אחר׳)
  7. מטרת ההתקשרות מצוינת
  8. הסכום המבוצע מצוין ואינו 0
  9. מטבע הרכישה מצוין
  10. ההזמנה אינה רגישה
  11. מטרת ההתקשרות מפורטת במידה מספיקה

 

ככל שההתקשרות היא על סכום גבוה יותר כך ההשפעה שלה על המדד הסופי גדולה יותר.

 

5 כוכבים

 

שיטת 5 הכוכבים קובעת מדרג של 5 קריטריונים למידע פתוח. לפיה, מוטב שהמידע יהיה פתוח חלקית מאשר שלא יהיה פתוח כלל.

ניתן לאמץ את הכוכבים שבדוגמה, את כולם או את חלקם, וניתן גם להגדיר כוכבים אחרים. הרעיון הוא לקבוע סדר עדיפויות ולתמרץ שחרור מידע גם אם אינו עומד בכל הקריטריונים של מידע פתוח.

 

★ לפרסם את המידע באינטרנט עם רישיון פתוח, בכל פורמט שהוא

★★ לפרסם את המידע בפורמט קריא מכונה

★★★ להוסיף מטה-דאטה ודברי הסבר

★★★★ מידע איכותי, נקי, שלם, עדכני, תואם פורמט סטנדרטי, מילון מושגי מפתח סטנדרטי ומזהה ייחודי עקבי

★★★★★ להקצות URI לכל פריט במאגר כדי שניתן יהיה להפנות אליו

 

הפרדה של מידע רגיש

במאגרים המכילים בין היתר מידע שחשיפתו עלולה להביא לפגיעה בפרטיות, יש לתת את הדעת מראש, בעת תכנון המאגר ובעת איסוף המידע, כיצד ניתן לגדר את המידע הרגיש ולהפריד אותו משאר הנתונים, כך שתהיה אפשרות לפרסם לפחות חלק מהמידע.