
به احتمال زیاد در سال های اخیر واژه کلان داده یا Big Data را شنیده اید. امروزه ما در عصری زندگی می کنیم که به صورت روزانه 3 بایت داده تولید می شود. آیا واقعا تمام این داده ها به درد ما می خورد؟ آیا می توان از این داده ها در تصمیمگیری های روزمره خود استفاده کنیم؟ مالکیت این داده ها برای چه شخص یا اشخاصی است؟ حقوق استارتاپها پر از نکات حقوقی پیچیده است. یکی از این پیچیدگی ها مربوط به استارتاپ های کلان داده است که باید به نکات حقوقی آن توجه نمود. کلانداده و وقایع و تحولاتی که روزانه در اطراف ما اتفاق میافتند، برای بسیاری از استارتاپهای کوچک نگران کننده هستند. در باور شرکتهای کوچک، روبهرو شدن با این هجمه اطلاعاتی مستلزم دستگاهی با توان پردازشی بسیار قوی است، درست مثل دستگاه بزرگی که در فیلم Billion Dollar Brain به نمایش گذاشته شده و روز و شب به کمک الگوریتم های پیچیده مشغول پردازش دادهها است. اما بهره برداری از کلان داده لزوما به این شکل انجام نمی شود. کلان داده، اقیانوسی از اطلاعات بالقوه و مفید است و شما می توانید حتی با فرو بردن نوک انگشت خود در آن، از این اطلاعات بهره مند شوید. تجزیه و تحلیل کلان داده فرآیند بررسی مجموعه های بزرگ اطلاعاتی است که شامل انواع متنوعی از داده ها هستند و برای کشف الگوهای پنهان، همبستگی ناشناخته، روند بازار، ترجیحات مشتری و سایر اطلاعات مفید پیرامون کسب و کار به کار گرفته می شوند.
منظور از کلان داده یا Big Data چیست؟
کلان داده به شیوه های مختلفی تعریف کردهاند. اما شاید بتوان به بهترین شکل کلان داده را اینگونه تعریف کرد:
دادهها و اطلاعات حجیم، گسترده، متنوع، سبک و سنگینی هستند که با سرعت بسیار زیادی تولید میشوند و برای پردازش آنها احتیاج به سیستمهای قدرتمند و مدرن روز است.
کلان داده میتواند در هر حوزهای به جمعآوری اطلاعات و با اهداف گوناگون استفاده شود. به طور مثال ممکن است یک شرکت بزرگ، اطلاعات کشور زندگی یا سن میلیونها کاربر خود را برای شخصیسازی خدمات تبلیغاتی خود جمعآوری کند.
از کلان داده میتوان در هر عرصهای از قبیل آموزش، بهداشت و درمان، تولید و فروش، امور نظامی، علوم اجتماعی و آماری، ورزش، اقدامات کلان دولتی و… استفاده کرد.
به طور خلاصه از کلان داده در کسبوکارها میتوان با اهداف زیر استفاده کرد:
- کاهش هزینههای مالی شرکت
- مدیریت زمان و سرعت بخشیدن به امور جاری
- ساخت محصولات جدید
- کمک به تصمیمگیریهای هوشمندانه تجاری، استخدامی، حقوقی و محاسبه ریسکها
- تعیین علل اصلی مشکلات تجاری و اقتصادی و حقوقی و استخدامی شرکت
تاریخچه کلان داده
همان گونه که گفته شد، واژه “کلان داده” برای داده هایی استفاده می شود که حجم بزرگی داشته باشند و یا انقدر پیچیده و سریع باشد که با روش های سنتی نتوان آن ها را پردازش کرد. عمل دستیابی و ذخیره سازی مقادیر بزرگ از داده ها، سال ها است که انجام می شود. اما مفهوم کلان داده برای اولین بار در اوایل دهه ۲۰۰۰ میلادی بیان شد. زمانی که داگ لنی، تحلیل گر صنعتی، جریان داده های بزرگ را با سه واژه بیان کرد:
حجم
سازمان ها داده ها را از منابع مختلفی از جمله معاملات تجاری ، دستگاه های هوشمند (IoT) ، تجهیزات صنعتی ، فیلم ها ، رسانه های اجتماعی و موارد دیگر جمع آوری می کنند. در گذشته ، ذخیره سازی این داده ها مشکل ایجاد می کرد. اما اکنون با پیشرفت علم و ابزار های ذخیره سازی این مشکل بر طرف شده است.
شتاب
با گسترش ابزار های اینترنتی، جریان داده ها با سرعتی بی سابقه به مشاغل رسیده و نیاز است تا این داده های بزرگ به سرعت بررسی و مدیریت شوند. برچسب ها ، سنسورها و کنتورهای هوشمند RFID نیاز به مقابله با این حجم از داده ها را در زمان تقریبا واقعی (real time) پاسخ می دهند.
تنوع
داده ها در انواع مختلفی از قالب ها – از داده های ساختار یافته و عددی در پایگاه های داده سنتی گرفته تا اسناد متنی بدون ساختار ، ایمیل ، فیلم ، audios ، داده تیک سهام و معاملات مالی – ارائه می شود.
در سال های اخیر واژگان دیگری نیز به این سه واژه اضافه شده است که عبارتند از:
تنوع پذیری
علاوه بر افزایش سرعت و تنوع داده ها، جریان داده ها غیرقابل پیش بینی هستند و اغلب تا حد زیادی تغییر می کنند. این مسئله برای کسب و کارهایی که با کلان داده ها سر و کار دارند چالش بر انگیز است، اما مشاغل باید پیش بینی کنند که چه چیزی در رسانه های اجتماعی قرار است رواج پیدا کند و یا به عبارتی ترند (trend) شود، و چگونه می توان بارهای داده های روزانه ، فصلی و… را مدیریت کرد.
صحت
کلمه صحت به کیفیت این داده ها اشاره دارد. از آنجا که داده ها از منابع مختلفی تهیه می شوند، پیوند، هماهنگی، پاکسازی و تبدیل داده ها در سیستم ها دشوار است. کسب و کارها باید روابط ، سلسله مراتب و پیوندهای داده های مختلف را به یکدیگر برقرار کنند. در غیر این صورت، این داده های جمع آوری شده می تواند به سرعت از کنترل خارج شوند.
استارتاپ کلانداده چیست؟
پیش از تعریف استارتاپ کلان داده لازم است معنای استارتاپ را شفافسازی کنیم. به طور خلاصه استارتاپها کسبوکارهایی هستند که با استفاده از دانش و فناوری روز در صدد حل مشکلات رایج در جامعه هستند.
استارتاپ کلان داده نیز استارتاپی است که خدمات تحلیل و بررسی و نتیجهگیری و تفسیر کلان دادهها را برای شرکتهای تجاری انجام میدهد. به بیان دیگر، یک استارتاپ کلان داده، کسب و کاری است که اطلاعات و دادههای مختلف و متنوع را برای کسبوکارها جمعآوری کرده و یا آنها را صرفاً تحلیل میکند. در نهایت نیز استارتاپ کلان داده گزارش و نتیجه آماری معناداری را به شرکت مورد نظر (مشتری) خود ارائه میدهد. اصولا استارتاپهای کلان داده با داشتن امکانات و دانش و تجهیزات لازم، میتوانند کلان داده ها را به خوبی تفسیر کنند و در ازای آن مبلغی دریافت کنند.
Sota Solutions، Prognostic، Terracotta و… از مشهورترین استارتاپهای کلان داده در سراسر جهان هستند.
مسائل حقوقی مهم برای استارتاپ کلانداده چیست؟
حال که با مفهوم استارتاپ کلان داده آشنا شدهایم لازم است برخی نکات حقوقی مهم درباره این شرکتها را مرور کنیم.
مهمترین نکته در بحث استارتاپهای کلانداده، موضوع مالکیت دادهها است. یک استارتاپ کلان داده باید توجه داشته باشد که موضوع تعلق دادهها و مالکیت فکری و مادی آنها چگونه است. به طور مثال برخی معتقدند دادهها به شرکت اولیه یا مشتری استارتاپ کلان داده تعلق داد و برخی دیگر میگویند تحلیل و تفسیر دادهها توسط استارتاپ مالکیت آن را تغییر میدهد. همچنین بحث مهمی در خصوص مالکیت دادهها به صاحبان آنها (مردم و کاربران) و یا شرکتهای جمعآوری کننده وجود دارد که باید به آن توجه کافی نشان داد. مورد دیگر، مسئله مهم محرمانگی اطلاعات است. استارتاپهای کلانداده بایستی به موضوع حفظ اسرار و عدم افشای اطلاعات و دادهها توجه کنند. به همین خاطر همواره تأکید میشود شرکتها با استارتاپهای کلان داده، قرارداد محرمانگی اطلاعات امضا کنند تا از اختلافات بعدی ناشی از افشای اطلاعات جلوگیری کنند. همچنین باید به یاد داشت که گاهی فعالیت استارتاپ کلان داده مشروط به اخذ مجوزهای دولتی خاصی است و این استارتاپها باید به این موضوع پیش از شروع به فعالیت توجه ویژه داشته باشند. در بسیاری مواقع استارتاپهای کلان داده جهت بهرهوری از دادههای سازمانهای دولتی و خصوصی، نیازمند عقد قرارداد و پایبندی به تعهداتی هستند که شناخت و بررسی دقیق آن، میتواند در استفاده کارآمد از دادهها و در نتیجه رشد آنها تاثیر گذار باشد.
نکات عمومی برای تأسیس استارتاپ کلان داده چیست؟
- حال که با مسائل حقوقی محتمل در فعالیت استارتاپ کلان داده آشنا شدهایم، لازم است تا برخی نکات مهم تأسیس استارتاپها، فارغ از نوع و موضوع فعالیت را مرور کنیم:
- راستیآزمایی استارتاپ
- مالکیت فکری
- تنظیم قرارداد همبنیانگذاری استارتاپ
- جذب سرمایه اولیه و آشنایی با راهکارهای تامین مالی مانند سرمایهگذاری جمعی
- تقسیم سهام استارتاپ
- تنظیم قرارداد عدم رقابت و محرمانگی اطلاعات
- ارزشگذاری استارتاپ
- قرارداد وستینگ
- توجه به موضوع استخدام نیروی انسانی و تنظیم قراردادهای کار
مزایا و معایب این فناوری
افزایش حجم دادههای موجود، فرصتها و مشکلاتی را به همراه دارد. به طور کلی، داشتن دادههای بیشتر در مورد مشتریان (و مشتریان بالقوه) باید به شرکتها اجازه دهد تا محصولات و تلاشهای بازاریابی خود را بهبود دهند تا بالاترین سطح رضایتمندی و تکرار خرید را ایجاد کنند. شرکتهایی که قادر به جمعآوری مقدار زیادی از دادهها هستند، امکان تجزیه و تحلیلهای عمیقتر و غنیتر را نیز دارند.
در حالی که تجزیه و تحلیل بهتر یک جنبه مثبت است، کلان داده همچنین میتواند اضافه بار و اختلال ایجاد کند. شرکتها باید بتوانند حجم بیشتری از دادهها را کنترل کنند، در حالی که تعیین میکنند کدام دادهها سیگنالها را نسبت به اختلال نشان میدهد. در واقع تعیین اینکه چه چیزی دادهها را مرتبط میکند به یک عامل مهم تبدیل میشود.
علاوه بر این، ماهیت و قالب دادهها میتواند نیاز به پردازش ویژه قبل از اقدام داشته باشد. دادههای ساختاری، متشکل از مقادیر عددی، به راحتی قابل ذخیره و مرتبسازی هستند. اما دادههای بدون ساختار مانند متن ایمیل، فیلم و اسناد متنی ممکن است نیاز به تکنیکهای پیشرفتهتری داشته باشند.