دادهها اطلاعات یا آمارهایی هستند که برای تحلیل و ارجاع گردآوری شدهاند. دادهها میتوانند شامل اعداد، متن یا ترکیبی از هر دو باشند. معمولا دادهها برای تسهیل تحلیل یا اتخاذ تصمیمات در موارد مختلف گردآوری میشوند. این فرآیند میتواند ساده باشد، مانند شمارش فروش یک محصول خاص، خواندن کنتور برق یا ثبت اسامی کارکنان یک شرکت یا میتواند کمی پیچیدهتر باشد، مانند نمایش فروش محصولات بر اساس موقعیت جغرافیایی یا سودآوری خدمت یا محصولی خاص. در این مقاله به بررسی جامع و کامل دادههای باز (Open Data) میپردازیم تا با مفهوم، کاربرد و ویژگیهای آن آشنا شوید.
دادههای باز (Open Data) چیست؟
دادههای باز دادههایی هستند که به طور آزادانه برای همه، از جمله شرکتها، شهروندان، رسانهها و مصرفکنندگان در دسترس هستند. در ادامه چند تعریف مشهور از مؤسسات و سازمانهای معتبر درباره دادههای باز آورده شده است:
- دادهها و محتوای باز میتوانند توسط هر کسی و به هر دلیلی به طور آزادانه استفاده شوند، تغییر کنند و به اشتراک گذاشته شوند. – بنیاد دانش باز [1]
- دادههای باز دادههایی هستند که هر کس میتواند به آنها دسترسی داشته باشد، از آنها استفاده کند یا آنها را به اشتراک بگذارد. – موسسه دادههای باز [2]
- دادههای باز شامل دادههایی هستند که برای استفاده مجدد در طول طیفی از باز بودن و شرایط استفاده مجدد در دسترس باشند. – آزمایشگاه سیاست دادههای باز [3]
تاریخچه کوتاه دادههای باز
اصطلاح دادههای باز اولین بار در سال ۱۹۹۵ به کار برده شد و به موضوع اشتراکگذاری دادههای ژئوفیزیکی و محیطی مرتبط بود. سپس این مفهوم در سال ۲۰۰۷ در جلسهای با حضور فعالان و متفکران حوزه اینترنت در سباستوپول [4]، کالیفرنیا، تعریف و تدوین شد. این مفهوم بر اساس جنبش منبع باز بنا شد و تمرکز آن بر اشتراکگذاری دادههای باز توسط نهادهای عمومی بود. با رشد جنبش دادههای باز، کشورها در سراسر جهان قوانینی را معرفی کردند که طبق آن دادههای نهادهای عمومی (مانند وزارتخانهها، سازمانها، شهرداریها و دیگر نهادهای محلی) باید به صورت دادههای باز در دسترس قرار بگیرند.
نمونههایی از دادههای باز دولتی عبارتند از:
- اطلاعات عملکردی/بودجهای
- دادههای باز GIS (سیستم اطلاعات جغرافیایی)
- پیشرفتهای اهداف عمومی
- فهرست درخواستها، مانند درخواست مجوزها در هر سازمان و ارگان
موج اول دادههای باز با قوانین و دستورالعملهای زیادی همراه بود که نیاز به دادههای باز را به دیگر بخشها مانند انرژی و خدمات عمومی و اپراتورهای حملونقل عمومی گسترش داد. اکنون شاهد تعداد فزایندهای از سازمانهای بخش خصوصی از جمله بانکها، شرکتهای مخابراتی و شرکتهای صنعتی هستیم که دادههای خود را باز میکنند، چرا که این امر به نفع کسبوکار آنها، اکوسیستم و روابطشان با مشتریان است.
تفاوت دادههای باز با دادههای بخش عمومی
بخش عمومی موظف است بسیاری از دادههای خود را یا به دلیل مقررات موجود یا به دلیل اهمیت دادهها برای حکمرانی و نظارت، به اشتراک بگذارد. این دادهها به عنوان دادههای باز از طریق کانالهایی مانند وبسایتها، پورتالها و اپلیکیشنها به اشتراک گذاشته میشوند.
با این حال، دادههای باز میتوانند توسط سازمانهای بخش خصوصی نیز منتشر و به اشتراک گذاشته شوند تا تعامل با ذینفعان را افزایش دهند و شفافیت ایجاد کنند. تعداد شرکتهایی که در بخشهای مختلف اطلاعات خود را به عنوان دادههای باز به اشتراک میگذارند در حال افزایش است.
بنابراین دادههای بخش عمومی همیشه دادههای باز هستند، اما دادههای باز الزاما نباید از بخش عمومی باشند.
ویژگیهای دادههای باز
دادهها زمانی به عنوان داده باز تلقی میشوند که سه معیار کلیدی زیر را داشته باشند:
دسترسی
دادهها باید به سادگی و به طور کامل، مثلا از طریق یک پورتال دادههای باز به صورت آنلاین و در فرمتی مناسب در دسترس باشند. مجموعه دادهها باید به صورت رایگان قابل دسترس باشند و سازمانها تنها در صورتی که هزینهای برای تکثیر دادهها (چاپ و ارسال اطلاعات) داشته باشند، مجاز به دریافت هزینه هستند.
استفاده و توزیع مجدد
افرادی که به دادهها دسترسی پیدا میکنند، باید مجاز به استفاده و توزیع مجدد آن و ترکیب آن با دیگر مجموعه دادهها باشند. بسته به نحوه مجوزدهی، ممکن است لازم باشد که منبع دادهها ذکر شود و هر مجموعه داده جدیدی که تولید میشود به اشتراک گذاشته شود.
قابلیت دسترسی برای همه
مجموعه دادههای باز باید به طور یکسان برای همه گروهها، از جمله شرکتهای بخش خصوصی، افراد، پژوهشگران یا سازمانهای عمومی در دسترس باشند. همه باید بتوانند با روشی که به راحتی قابل درک باشد، با هر هدفی از دادهها استفاده، استفاده مجدد و آنها را توزیع مجدد کنند.
دسترسی به دادههای دقیق و بهروز به وضوح برای درک آنچه درون یک سازمان در حال رخ دادن است و همچنین برای افرادی که به دنبال مدیریت زندگی روزمره خود هستند، حیاتی است. با این حال، اغلب این دادهها در سیستمهای جداگانه (سیلو) قرار دارند و تنها گروههای خاصی در یک سازمان قادر به دسترسی به آنها هستند. این موضوع باعث میشود دادهها نتوانند ارزش واقعی خود را برای همه افراد و گروهها به نمایش بگذارند، به همین دلیل لازم است این دادهها به صورت باز در دسترس قرار گیرند.
اهمیت دسترسی به دادههای دقیق و بهروز
تصمیمگیری بهتر
دسترسی به دادههای دقیق به مدیران و تصمیمگیران کمک میکند تا تحلیلهای بهتری از وضعیت فعلی داشته باشند و بر اساس آن تصمیمات بهتر و درستتری اتخاذ کنند.
افزایش شفافیت
هنگامی که دادهها به صورت عمومی در دسترس باشند، سازمانها و افراد میتوانند شفافیت بیشتری در عملکردها و تصمیمات خود ایجاد کنند.
توانمندسازی افراد
افراد میتوانند با دسترسی به دادههای مربوطه، زندگی خود را بهتر مدیریت کنند و برای تصمیمات روزمره خود، بر اساس اطلاعات معتبر عمل کنند و تصمیم بگیرند.
چالشهای دسترسی به دادههای دقیق
- فقدان دسترسی: وقتی دادهها در سیستمهای جداگانه قرار دارند، بسیاری از افراد و حتی برخی از بخشهای سازمان از این اطلاعات بیخبر هستند.
- عدم تجزیه و تحلیل مناسب: دادههای ناقص یا قدیمی میتوانند منجر به تجزیه و تحلیل نادرست شوند، که میتواند روی تصمیمگیری تأثیرات منفی داشته باشد.
ضرورت ایجاد دادههای باز
- توزیع عادلانه اطلاعات: با ایجاد دادههای باز، هر فرد یا گروهی که به آن نیاز دارد میتواند به راحتی به اطلاعات دسترسی پیدا کند و از آن بهرهبرداری کند.
- افزایش نوآوری: دسترسی به دادههای باز میتواند به محققان، توسعهدهندگان و شرکتها کمک کند تا بر اساس این دادهها نوآوریهای جدید ایجاد کنند.
- ایجاد فرصتهای همکاری: با به اشتراکگذاری دادهها، گروهها و سازمانهای مختلف میتوانند به راحتی با یکدیگر همکاری کنند و از تجربیات یکدیگر بهرهمند شوند.
در نهایت برای به حداکثر رساندن ارزش دادهها و تحقق پتانسیل واقعی آنها، ضروری است که سازمانها دادههای خود را به صورت دادههای باز ارائه کنند و به راحتی در دسترس عموم قرار دهند. این اقدام نه تنها به خود سازمانها کمک میکند تا به درک بهتری از عملکرد خود برسند، بلکه به افراد و جامعه هم این امکان را میدهد تا به طور مؤثرتری زندگی خود را مدیریت کنند.
چرا به دادههای باز نیاز داریم؟ مزایای آن چیست؟
در دنیایی زندگی میکنیم که توسط دادهها قدرت میگیرد. دادهها بخش حیاتی زندگی ما و کار ما هستند. با به اشتراکگذاری اطلاعات حیاتی، دادههای باز به شهروندان، کارمندان و سازمانها قدرت میدهند. این دادهها به افراد بینشی میدهند تا تصمیمات بهتری اتخاذ کنند و در عین حال اطمینان حاصل شود که آنها به طور کامل از اقدامات و فعالیتهای سازمانهای خصوصی آگاه هستند.
شفافیت بیشتر
اشتراکگذاری دادههای باز به شهروندان و مصرفکنندگان کمک میکند تا عملکرد و کارکرد نهادهای بخش عمومی و شرکتهای خصوصی را بهتر درک کنند. این امر تعامل را افزایش داده و اعتماد بیشتری ایجاد میکند و با در دسترس قرار دادن اطلاعات، شهروندان میتوانند عملکرد بخش عمومی را نظارت کنند و مصرفکنندگان میتوانند به دادههایی مانند تلاشهای شرکتها در زمینه پایداری، کیفیت و تنوع نیروی کار دسترسی داشته باشند.
تقویت نوآوری و رشد
بهرهگیری از دادههای باز به سازمانها کمک میکند تا نوآورانهتر عمل کنند و تصمیمات دادهمحور بگیرند. سازمانها میتوانند خدمات و کسبوکارهای جدید ایجاد کنند و با تکمیل اطلاعات خود، به بینشهای عمیقتری دست یابند. این موضوع فرآیند بهرهوری را افزایش میدهد، نوآوری را تحریک میکند و عملکرد کلی سازمانها را بهبود میبخشد.
مدیریت بهتر سیاستهای عمومی
اشتراکگذاری دادهها در بخش عمومی باعث ایجاد همکاری بیشتر بین نهادهای دولتی میشود. این امر مرزهای سازمانی را از بین میبرد و اطمینان میدهد تصمیمات بر اساس تصویر کاملی از اطلاعات موجود اتخاذ میشوند. همچنین، بخشهای مختلف دولت نیازی به جمعآوری دادههای جداگانه ندارند و این موضوع بهبود بهرهوری را به همراه دارد. شفافیت در عملکرد و پیگیری پیشرفت به دولتها کمک میکند عملکرد خود را اندازهگیری کرده و بر دستیابی به اهداف متمرکز شوند.
مزایای فرهنگی و محیطزیستی
مردم امروزه خواستار شفافیت هستند و دادههای باز به آنها دید کامل میدهد. به عنوان مثال، با ترکیب دادههای باز از سازمانهای مختلف، شهرها میتوانند اطلاعات فرهنگی کاملی را برای برنامهریزی سفر به بازدیدکنندگان ارائه دهند. همچنین با استفاده از دادههای زیستمحیطی از منابع مختلف (مانند کیفیت هوا، انتشار گازهای گلخانهای و بهرهوری انرژی)، شهرها میتوانند اثرات زیستمحیطی خود را اندازهگیری کرده و اقداماتی برای بهبود انجام دهند.
کدام بخشها میتوانند دادههای خود را باز کنند؟
در حالی که جنبش دادههای باز در ابتدا از بخش عمومی آغاز شد و توسط قوانین مربوط به دادههای باز دولتی هدایت میشد، سازمانها در هر بخش میتوانند با باز کردن دادههای خود از این مزایا بهرهمند شوند. در صنایع تحت نظارت بخش عمومی و همچنین صنایع وابسته، به اشتراکگذاری دادهها منجر به افزایش بهرهوری، بهبود تعامل با مشتریان، شهروندان و کارمندان، افزایش نوآوری از طریق به اشتراکگذاری ایدهها و ایجاد خدمات جدید و افزایش همکاری بین بازیگران مختلف در صنایع میشود.
شهرداریها و دولتهای محلی
شهرداریها با چالشهای متعددی مواجه هستند تا بتوانند شهرهای هوشمند کارآمد و با هزینه بهینه ایجاد کنند. آنها باید از نظر عملیاتی کارآمدتر شوند، پایداری خود را بهبود بخشند و از همه مهمتر، خدمات و تجربیاتی را ارائه کنند که شهروندان آگاه به فناوری به طور فزاینده از آنها انتظار دارند. دادههای باز برای برآورده کردن همه این نیازها حیاتی است.
دولت و سازمانها
تصمیمگیریهای دولت باید بر اساس دادههای جامع و قابل اعتماد باشد. این دادهها باید دقیق باشند و بهراحتی میان سازمانهای مختلف در سطوح استانی و کشوری به اشتراک گذاشته شوند تا بتوان تصمیمگیریها را توجیه کرد و اطمینان حاصل شود که این دادهها به طور کارآمد و مؤثر استفاده میشوند.
انرژی و خدمات عمومیِ شهری
شرکتهای خدماتی در حوزه انرژی و آب و خدمات عمومی شهری با چالشهای متعددی در زمینه کربنزدایی، بهبود بهرهوری و پاسخگویی به نیازهای در حال تغییر مشتریان مواجه هستند. دستیابی به این اهداف نیازمند دیجیتالیسازی عملیات، از بین بردن سیلوهای موجود بین بخشهای مختلف و ایجاد جوامع قدرتمند حول دادههای آنها برای تسهیل انتقال به صفر خالص (Net Zero) است.
شرکتهای بخش خصوصی
شرکتهای بخش خصوصی به طور فزایندهای در حال پذیرش دادههای باز هستند. در بسیاری از صنایع و مناطق، مقررات جدید (مانند قانون دادههای اتحادیه اروپا) شرکتهای بزرگتر را ملزم میکنند تا دادههای خود را در دسترس عموم قرار دهند. به همین ترتیب، شرکتهای نوآور در تمام بخشها، به خوبی از مزایایی که دادههای باز ارائه میدهند آگاه هستند. این مزایا شامل برقراری ارتباط بهتر با ذینفعان و مشتریان و افزایش شفافیت است.
آمادهسازی دادهها
دادههای باز باید قابل اعتماد، ساختاریافته و بهراحتی توسط انسان و ماشینها قابل فهم باشد. افراد از دادههای ناقص، بیکیفیت، پیچیده یا فاقد ساختار استفاده نخواهند کرد یا استفاده از آنها راحت نخواهد بود. برای اطمینان از اینکه دادههای باز نیازهای کاربران را برآورده میکند، سازمانها باید دادههای خود را به درستی آماده کنند.
دادههای باکیفیت
کیفیت دادهها بر اساس معیارهایی مانند دقت، جامعیت، بههنگام بودن، سازگاری و قابلیت اطمینان اندازهگیری میشود. کیفیت دادهها پایه و اساس موفقیت در اشتراکگذاری دادههاست. دادههای با کیفیت پایین یا توسط ذینفعان مورد استفاده قرار نمیگیرد یا تحلیلهای نادرستی را در اختیار تصمیمگیرندگان قرار میدهند. از این رو، تضمین کیفیت دادهها یک فرآیند حیاتی است و برای موفقیت برنامههای دادههای باز ضروری به شمار میرود.
غنیسازی دادهها
برای ارزش بیشتر مجموعه دادهها، میتوان آنها را با اطلاعات اضافی غنیسازی کرد. این اطلاعات میتوانند از منابع داخلی یا خارجی سازمان تأمین شوند. افزودن دادههایی از منابع رسمی مثل دادههای مربوط به شرایط جوی یا دادههای به دست آمده از سایر سازمانها از جمله این موارد هستند. این اطلاعات اضافی، زمینه و بستر لازم را فراهم میکنند و در هنگام اشتراکگذاری مجموعه دادهها، آنها را کاربردیتر و مفیدتر میسازند.
فرآیند مدیریت دادهها
مدیریت دادهها باید فرآیندی شفاف و تعریفشده باشد که در آمادهسازی دادههای باز قابل انتشار نقش اساسی ایفا میکند. سازمانها باید متدولوژی جامعی از ابتدا تا انتها ایجاد کنند که تمامی مراحل مختلف مرتبط با مدیریت دادهها، از آمادهسازی تا استفاده نهایی را پوشش دهد.
اهمیت فراداده (Metadata)
دادهها بدون داشتن زمینه یا ساختار، بیمعنی هستند. فراداده این مشکل را حل میکند. اساسا، فراداده دادهای است که دیگر دادهها را توصیف میکند و هدف آن ایجاد زمینه برای پاسخ به سوالات اساسی مانند چه کسی، چه چیزی، کجا، چه زمانی، چگونه و چراست. فراداده به انسانها و ابزارهای فناوری این امکان را میدهد که به راحتی بفهمند دادههای شما چه موضوعی را پوشش میدهد و در چه قالبی ارائه شده است.
مدیریت صحیح فراداده برای موفقیت در انتشار دادههای باز حیاتی است. ابتدا، سازمانها باید یک نظام طبقهبندی برای دادههای خود ایجاد کنند و واژگان مشترکی را طراحی کنند که دادهها را توصیف کند. این نظام باید به وضوح تعریف شده و صرف نظر از میزان دانش فنی، برای همه قابل درک باشد.
حاکمیت، ابزارها و فرهنگ؛ سه کلید اصلی برای راهاندازی پروژههای Open Data
باز کردن دادهها ممکن است ساده به نظر برسد. با این حال، دادهها اغلب در سیستمهای مختلف یک سازمان ذخیره شدهاند و ممکن است با زبانها و واژگان متفاوتی توصیف و توسط بخشهای مختلفی کنترل شوند. این بدان معناست که جمعآوری و اشتراکگذاری مجموعه دادههای متعدد، در حالی که اطمینان حاصل شود این دادهها قابل اعتماد، با کیفیت بالا و بهروز هستند، به سرعت به یک پروژه بزرگ تبدیل میشود و ممکن است منابع قابل توجهی را نیاز داشته باشد. برای موفقیت، تمرکز بر سه حوزه کلیدی ضروری است:
- حاکمیت: ایجاد چارچوب حاکمیت داده، بهمنظور تعریف سیاستها، فرآیندها و مسئولیتها ضروری است. این چارچوب باید به وضوح مشخص کند که چه کسی مسئول مدیریت دادههاست، چه قوانینی برای استفاده و به اشتراکگذاری دادهها وجود دارد و چگونه از امنیت و حریم خصوصی دادهها محافظت میشود.
- ابزارها: استفاده از ابزارهای مناسب برای مدیریت، تجزیه و تحلیل و انتشار دادهها امری حیاتی است. ابزارهای پیشرفته نه تنها به شما کمک میکنند دادهها را سازماندهی و پردازش کنید، بلکه در به اشتراکگذاری آسان دادهها در سراسر سازمان و با عموم مردم هم نقش پررنگی دارند. انتخاب ابزارهایی که با نیازهای سازمان و فرآیندهای حاکمیتی هماهنگ هستند بسیار مهم است.
- فرهنگ: برای موفقیت در پروژههای دادههای باز، سازمانها باید فرهنگ دادهمحور را ارتقاء دهند. آموزش کارکنان برای درک اهمیت دادههای باز، توسعه مهارتهای تحلیلی و ترغیب به همکاری در سراسر بخشها از جمله اقدامات مهم هستند. پذیرش فرهنگ Open Data و اشتراکگذاری دادهها از سوی تمام اعضای سازمان، کلید موفقیت در پروژههای دادههای باز است.
در نهایت، برای اجرای موفقیتآمیز یک پروژه دادههای باز، باید بین این سه حوزه تعادل برقرار کرد. حاکمیت به شفافیت و اعتمادسازی کمک میکند، ابزارها توانایی مدیریت و انتشار دادهها را فراهم میسازند، و فرهنگ سازمانی پذیرش و استفاده مؤثر از دادهها را تقویت میکند.
پایان سخن؛ بلوغ Open Data
اشتراکگذاری دادههای باز فرآیندی مستمر برای بهبود است. سازمانها درک میکنند همواره دادههای بیشتری وجود دارد که میتوانند به اشتراک بگذارند، روشهای جدیدی برای ارائه آنها به منظور افزایش تعامل با ذینفعان وجود دارد و راهکارهای نوآورانه برای ترکیب دادهها با دیگر مجموعهها به منظور افزایش ارزش اطلاعاتی آنها قابل استفاده است.
به همین دلیل، مطالعات مختلفی برای اندازهگیری سطح بلوغ دادههای باز در کشورهای مختلف و سازمانها انجام میشود. این مطالعات امکان مقایسه رهبران این حوزه با آنهایی که در مراحل اولیه این مسیر قرار دارند را فراهم کرده و به همه کمک میکند تا از بهترین شیوهها بیاموزند و از آخرین روندها پیروی کنند.
یکی از مهمترین مطالعات بینالمللی در این زمینه، گزارش بلوغ دادههای باز کمیسیون اروپا [5] است. این مطالعه سالانه ارزیابی میکند که ۳۵ کشور اروپایی چگونه به اشتراکگذاری دادههای باز میپردازند و پیشرفت آنها را بر اساس چهار معیار کلیدی اندازهگیری میکند:
- سیاست ملی دادههای باز
- تأثیر دادههای باز در کشور
- قدرت پورتال دادههای باز
- کیفیت دادهها/فرادادهها در آن
علاوه بر این، مجموعهای از سازمانهای غیرانتفاعی، ابزارها و چارچوبهایی را برای کمک به افزایش بلوغ اشتراکگذاری دادههای باز توسعه دادهاند. به عنوان مثال، موسسه دادههای باز [6] مدل بلوغ دادههای باز خود را طراحی کرده است که به سازمانها کمک میکند ارزیابی کنند تا چه میزان دادههای خود را به اشتراک میگذارند و از آن استفاده میکنند تا اقداماتی را برای بهبود شناسایی کنند. این مدل در سراسر جهان توسط سازمانها مورد استفاده قرار گرفته است.
در مجموع، رویکردهای مختلف به بلوغ دادههای باز به سازمانها این امکان را میدهند که همزمان با رشد و توسعه اشتراکگذاری دادهها، اثربخشی و دسترسپذیری آنها را نیز بهبود بخشند. استفاده از این مدلها و الگوها، سازمانها را به سمت بهبود فرآیندهای اشتراکگذاری دادهها و پیروی از بهترین شیوهها هدایت میکند.
[1] Open Knowledge Foundation
[2] Open Data Institute
[3] Open Data Policy Lab
[4] Sebastopol
[5] European Commission’s Open Data Maturity
[6] Open Data Institute