ניר עמדה – כנסת שקופה
7 בספטמבר 2015
לכבוד חה”כ סתיו שפיר, יו”ר
הועדה המיוחדת ליישום הנגשת המידע הממשלתי ועקרונות שקיפותו לציבור
הכנסת
הנדון: הנגשת המידע המתפרסם באתר האינטרנט של הכנסת לציבור הרחב
אנו מברכים את הוועדה על קיום ישיבה מיוחדת לציון שבוע הליכי חקיקה פתוחים ברחבי פרלמנטים בעולם. לקראת הדיון הראשון, בנושא גיבוש אמנה משותפת לשקיפות ישראלית, אנו מתכבדים להגיש לוועדה את עמדתנו בנוגע לשקיפות ונגישות המידע המתפרסם על-ידי הכנסת ודרכים לשיפור.
הסדנא לידע ציבורי היא עמותה מבוססת מתנדבים המפעילה, בין היתר, את האתרים “כנסת פתוחה”, “מפתח התקציב”, ו”ספר החוקים הפתוח”, ופועלת להגברת שקיפות ממשלתית, הנגשת מידע והשתתפות ציבורית. מסמך זה מבוסס על נסיוננו בפיתוח למעלה מ-15 אתרים להנגשת מידע ממשלתי לציבור ועל הידע הטכנולוגי שנצבר אצלנו ובארגונים דומים בעולם בתחום זה.
אתר האינטרנט של הכנסת – משקיפות לנגישות
- הכנסת משקיעה מאמצים ניכרים על מנת לייצר שקיפות בכל הנוגע לעבודה הפרלמנטרית של נבחרי הציבור, ובכך עבודתה ראויה לציון. באתר הכנסת ניתן לעקוב אחרי פעילות הוועדות והמליאות, לרבות סדר היום, הפרוטוקולים, הנוכחות וההצבעות. ניתן לצפות בפרופילים של ח”כים ובהצעות החוק שלהם. לאחרונה עלו לרשת גם מאגר השאילתות וכן מאגר החוקים של מדינת ישראל. ברמת הקשר עם הציבור באמצעות הרשתות החברתיות, לכנסת יש פעילות עקבית ואינפורמטיבית.
- יחד עם זאת יש לעמוד על ההבדל בין שקיפות לנגישות לציבור, ולהכיר בכך ששקיפות גרידא אינה מבטיחה השתתפות אזרחית. הכנסת אמנם מעמידה מידע רב באופן מקוון באתר שלה, אך הפורמט שלו, האופן שבו הוא מאורגן והחסמים בגישה למידע הגולמי יוצרים מצב שבו המידע פעמים רבות אינו נגיש או שימושי.
- זוהי שעת כושר לבצע את המעבר משקיפות לנגישות של הכנסת. בהקשר זה, ניתן להתייחס לפרוייקט “כנסת פתוחה” (oknesset.org) של הסדנא לידע ציבורי כניסוי מעשי בהנגשת מידע לציבור, שמלמד רבות גם על אופי ההתעניינות הציבורית במידע וגם על הסוגיות הטכניות הכרוכות בהנגשת מידע. ההצעות לשיפור המובאות בהמשך הן פועל יוצא של ההתנסות בת שש השנים של “כנסת פתוחה” ושל פרויקט “ספר החוקים הפתוח”.
עקרונות כלליים בהנגשת מידע:
- רישיון פתוח (Creative Commons) – כיום, הכנסת טוענת לזכויות יוצרים על כל המידע המתפרסם באתר הכנסת (http://main.knesset.gov.il/About/Pages/Copyright.aspx). כך, למשל, נוצר מצב אבסורדי שבו חברי הכנסת עצמם אינם רשאים לעשות שימוש בתמונותיהם המתפרסמות באתר ללא רשות מהכנסת. מצב דברים זה אינו ראוי ואינו משקף את העובדה כי מידע ציבורי שייך לציבור. על כן יש להקנות לכל המידע המתפרסם על ידי הכנסת רישיון פתוח, כפי שנעשה בפרלמנטים אחרים בעולם כגון הפרלמנט הבריטי, הצרפתי, האמריקאי והצ’יליאני.
- פרסום עיתי – חלק מן המידע שמפרסמת הכנסת מתפרסם בעיכוב ניכר. הדבר בולט במיוחד בפרסום הפרוטוקלים של ישיבות וועדת הכנסת, אשר עולים לאתר לעיתים רק שבועות ארוכים לאחר קיום הישיבה.
- שיתוף פעולה עם החברה האזרחית ושיתוף הציבור – יש לפרסם תוכנית עבודה של הכנסת בנושא התקשוב ולשתף את הציבור באיפיון אתר הכנסת, על מנת ללמוד על צרכי הציבור ולהבטיח כי האתר מספק מענה ראוי להם.
- שיפור איכות ואמינות המידע המתפרסם – יש להעמיד את המידע המתפרסם בפורמטים שמאפשרים איתור על ידי מנועי חיפוש ושימוש על ידי מפתחים, כפי שנעשה בפרלמנטים אחרים בעולם (ראו, למשל, את יוזמת data.parliament.uk בבריטניה).
א. פרסום מידע בפורמט קריא מכונה – המסמכים באתר הכנסת רובם ככולם בפורמט PDF (כגון חוקי המדינה) או DOC (כגון פרוטוקולים). מסמכים כאלה אינם נגישים למנוע חיפוש. החיפוש היחיד האפשרי הוא ברמת הכותרת, שלעיתים קרובות אינה תואמת את תוכן המסמך. בפרט, טקסט בקובץ PDF כלל אינו ניתן לפיענוח דיגיטלי ולניתוח טקסטואלי. מומלץ להשתמש בפורמטים CSV, JSON, XML, RDF ודומיהם. את הקבצים שקיימים רק כ-PDF מומלץ להמיר לטקסט קריא מכונה.
לסדנא ניסיון רב בביצוע המרות מסוג זה אותו היא תשמח להעמיד לרשות הכנסת. כך, למשל, בפרויקט “ספר החוקים הפתוח” (www.openlaw.org.il) חוקים המתפרסמים ברשומות או במאגר החקיקה הלאומי מומרים לפורמט קריא מכונה ומתפרסמים בנוסח משולב.
ב. הוספת מידע תיאורי (metadata) – לכל קובץ יש להוסיף תיאור מקוצר של התוכן שלו, כגון תאריך, מספר נוכחים, מספר סידורי של פרוטוקול, מזהה ייחודי של הצעת חוק, מציע החוק וכד’. זאת כדי להקל על ניתוח דיגיטלי של המידע. הדבר תקף גם למסמכי מרכז המחקר של הכנסת. בתוך כל מסמך כזה מצוין הגורם שעבורו נכתב: ח”כ או ועדה, או איזכור הן של הועדה והן של יושב הראש שלה. ללא ה-metadata לא ניתן לחפש מסמכים של הממ”מ לפי הגורם שהזמין את המסמך.
ג. שיפור הממשק למפתחים (API) – על מנת לגשת לאתר ולקבל אוטומטית נתונים גולמיים. למשל לקבל תשובה לשאילתה “אילו ועדות התקיימו בתאריך X” או “מי נכח במליאה בתאריך Y”. כיום ממשק המפתחים שמעמידה הכנסת אינו מתועד, לוקה בחסר ולא אמין. לכן מי שמעוניין לבצע ניתוח של המידע נאלץ להשתמש בשיטות של “גירוד מידע” (scraping) הפוגעות באמינות הניתוח.
הצעות מעשיות לשיפורים שניתן לבצע באופן מיידי:
- שיוך מזהה ייחודי להצעת חוק שילווה את החוק בשלבי החקיקה השונים – על מנת לאפשר מעקב אחרי שלבי חקיקת החוק.
- שחרור ה-metadata של הליך החוקים והתקנות – אתר מאגר החקיקה של הכנסת כולל מידע אודות הליך החקיקה. ניתן לפרסם את המידע בפורמט טבלאי. בידי משרד המשפטים מידע דומה אודות קבצי התקנות, שגם אותו ניתן לפרסם בפורמט טבלאי.
- תיעוד דיגיטלי של נוכחות ח”כים ולוביסטים בועדות – במקום רישום ידני, שפעמים רבות הינו חסר ומהווה פתח לטעויות בשל רישום שמות בדרכים שונות.
- תיעוד דיגיטלי ושמי של ההצבעות בוועדות – כיום קיים תיעוד חלקי בלבד, שאינו שמי.
- תיעוד נוכחות חברי הכנסת במליאה – כיום אין תיעוד.
- קיצור זמן פרסום פרוטוקולים של ועדות – ניתן לפרסם נוסח זמני עד לפרסום רשמי, כפי שנעשה כיום עם פרסום הדיונים במליאה.
- פירוט לגבי עלות תקציבית של הצעות חוק פרטיות – כיום ניתן למצוא נתונים חלקיים בלבד בפרוטוקולים. יש לציין אם הוגשה לועדה הערכת עלות תקציבית מטעם משרד האוצר ומטעם הממ”מ, ומה הייתה החלטת הוועדה, תוך הפניות למסמכים ולפרוטוקולים המתאימים.
אנו נשמח לשתף פעולה עם הגורמים השונים בכנסת על מנת לסייע בנקיטת הצעדים שיבטיחו כי המידע המתפרסם נגיש ושימושי וכי הכנסת עומדת בשורה אחת עם פרלמנטרים מתקדמים בעולם בכל הנוגע לשקיפות ונגישות.