Big Data, блокчейн, машинное обучение — объясняем термины на ёжиках
Искусственный интеллект и машинное обучение всё чаще используются компаниями в маркетинге. О том, как и для чего они применяются в работе, расскажем в следующих статьях. А чтобы лучше понимать, как устроены эти технологии, мы подготовили для вас тематический словарь с наглядными примерами. Объясняем термины так просто, чтобы и ежу стало понятно.
Искусственный интеллект
Он же ИИ, Artificial Intelligence, AI
Точного определения не существует, совсем как в философии. Всё зависит от того, что именно понимать под словами «разум» и «интеллект». Считать это только свойством людей? Или некоторые животные тоже разумны и обладают интеллектом? В целом, искусственный интеллект — это свойство систем имитировать либо психические процессы человека, либо разумное поведение и возможность совершать выбор.
Представьте, вы мечтаете завести ежа. Останавливает только аллергия на этих животных. Тогда друзья предлагают купить робоёжика. Он должен уметь воспроизводить поведение настоящего ежа: фыркать, выражая своё недовольство, сворачиваться в клубочек, когда его пытаются погладить, громко топать лапками по ночам, любить хозяина и кусать незнакомых ему людей. Если ваш робоёж умеет всё это, то можете смело говорить, что он обладает искусственным интеллектом.
Большие данные
Они же Big Data
Вроде сразу понятно, большие данные — это много каких-то данных. Но всё не так просто. Для начала, много — это сколько? Три, десять, миллион, миллиард? А чего — мегабайтов, гигабайтов, терабайтов? Насчёт этого нет единого мнения. Кто-то думает, что это когда данные нельзя посчитать на одном компьютере, кто-то — когда ежедневный поток информации превышает 100 Гб в день. Принято считать, что большие данные — это не только сами данные, но ещё и инструменты, подходы и методы обработки информации.
Допустим, есть задание от Гринпис: каждый день считать белобрюхих, ушастых и африканских карликовых ежей, живущих на территории заповедника. Это нужно, чтобы сравнить их количество между собой и посмотреть, не уменьшается ли популяция одного из видов ежей.
Каждый день вы собираете всех ёжиков и распределяете по трём комнатам.
Если в заповеднике 100 ёжиков, задача кажется легкой. С 1000 ежей становится сложнее (не забывайте, они могут выбегать). А если у вас самый большой в мире ежиный заповедник, то вручную животных уже не посчитать — в этот момент они станут большими данными. Вам придётся обзавестись инструментом обработки больших данных — умным автоматическим сортировщиком ежей. Он не только распределит и посчитает животных, но и найдёт новые зависимости, например, сезонные колебания в ежиной популяции.
Блокчейн
От англ. Blockchain
Блокчейн — это не только про криптовалюту! Это технология хранения информации в цепочке блоков. Каждый из блоков содержит данные о всей предыдущей цепочке: известно, что именно хранится в предыдущих блоках, кто и когда создал информацию, переместил её или изменил. Все сведения дублируются на разных компьютерах, возможно, в разных странах. Благодаря этому подделать их просто невозможно.
Предположим, все записи с камер наблюдения района хранятся с помощью технологии блокчейн: запись одного дня с одной камеры — один блок, в новом блоке содержится видеозапись нового дня и код-идентификатор предыдущего блока. Полицейский получает доступ ко всем камерам, на которых виден сад соседа. Затем он ищет код с нужной камеры, смотрит на идентификатор видео, где Соник крадёт алмаз и понимает, что видео сфабриковано. Теперь можно дальше счастливо есть пиццу, а сосед будет отрабатывать наказание за клевету!
Машинное обучение
Оно же МО, Machine Learning, ML
Это алгоритмы, обучающиеся самостоятельно или с помощью учителя. Выглядит это примерно так:
- Собираются данные.
- Делятся примерно в отношении 80/20 для обучения и проверки.
- Выбирается модель, подходящая для нашей задачи.
- Модель обучается.
- Результаты оцениваются и отправляются на доработку при недостаточной точности.
С помощью методов машинного обучения можно научить компьютеры распознавать ёжиков или рисовать их. Ниже расскажем про два разных подхода с конкретными примерами.
1. Градиентный бустинг
От англ. Gradient Boosting
Это способ последовательного построения алгоритмов. Каждый новый алгоритм создаётся, чтобы исправить недостатки предыдущего.
Например, мы придумываем алгоритм, определяющий породу ежей. Для начала смотрим их размеры: большой ёж, средний или маленький. Это наше первое простое дерево решений. Затем ещё несколько:
- по длине иголок;
- по основному цвету;
- по форме ушек.
Далее соединяем все признаки в одно дерево и получаем заготовку, словно мы делаем тест «Какой вы ёжик». Все породы такой тест не покроет, поэтому придётся построить ещё одно дерево с учётом получившейся ошибки. Каждое новое дерево будет уменьшать ошибку и точнее определять породу ежей.
2. Нейронные сети
От англ. Artificial neural network
Это аналог нейронных сетей человеческого мозга. Много маленьких нейронов решают свои простейшие операции. Они взаимосвязаны и вместе выполняют сложные функции.
Предположим, мы много раз сфотографировали и нарисовали ежей, показали компьютеру и сказали: «Смотри, всё это ёжики». Он проанализировал картинки, наложил их друг на друга и выделил признаки ежа. В результате получилось представление — его называют слоем свёртки. Человек, который посмотрит на него, скорее всего, не поймет, почему алгоритм так видит ёжиков. Он увидит только набор пикселей. Такой сверточной нейронной сети теперь можно показать видео из заповедника, а она посчитает, сколько ежей там живет.
Модель машинного обучения
Она же ML model
Это конкретный обученный алгоритм. Модель со своим набором признаков (фич) решает только тот тип задач, для которого была построена. Как ёжик, которого научили ловить определённый вид гусениц.
Фича
От англ. feature — особенность, характеристика, свойство
Это сленговое обозначение признаков, применяющихся в моделях. Помните, мы в градиентном бустинге строили деревья для определения породы ежа? Так вот, форма ушек — это фича. Как и длина иголок.
Если вы хотите подробнее узнать, как устроено машинное обучение, где мы сталкиваемся с ним в жизни и как оно используется в маркетинге, переходите на статью «Вторжение машинного обучения: от заказа такси до персонализации контента».
Big Data и блокчейн: комбо или противостояние?
Сегодня большие данные и технологии распределенного реестра до сих пор являются самыми популярными ИТ-темами. Возможности их внедрения в каждую прикладную сферу, от банковской отрасли до медицины, обсуждаются на конференциях всех уровней, корпоративных совещаниях и государственных советах [1]. Принесет ли объединение Big Data и блокчейн дополнительные бонусы, в каких случаях не нужно комбинировать эти технологии и есть ли примеры их совместного использования на практике – анализируем мнения экспертов и прикладные кейсы.
Почему блокчейн не нужен во всех проектах Big Data?
Прежде всего следует подчеркнуть принципиальное различие технологий распределенного реестра и больших данных: Big Data предполагает интеграцию информации из различных источников, тогда как в блокчейне, наоборот, копии информационных цепочек хранятся на множестве разных компьютеров [2]. Децентрализованное хранение и последовательный характер записи данных и обусловливает достаточно низкую скорость их считывания. В частности, пропускная способность популярных криптовалют, основанных на блокчейне, не превышает 10 тысяч транзакций в секунду, несмотря множество проектов, направленных на увеличение этого показателя. При этом скорость сети международной платежной системы Visa, работающей через централизованные сервера, составляет 24 тысячи транзакций в секунду
Данные, которые попали в блокчейн, остаются там навсегда. Поэтому применять эту технологию имеет смысл только в тех задачах, где необходимо постоянное хранение неизменяемой информации, в т.ч. устаревшей и уже неиспользуемой [2]. Но такой потребности нет в отраслях с высокой динамикой изменений и достаточно низкой ценностью каждой отдельной записи, таких как, например, сведения о покупках конкретного покупателя в определенный день. Сегодня именно сфера маркетинга наиболее активно использует большие данные для персонализации рекламных предложений, о чем мы уже рассказывали здесь. И в этом случае блокчейн совершенно не нужен решениям Big Data, чтобы составить детальный портрет потребителя или управлять корпоративной репутацией в интернете.
Когда полезно совместить большие данные с блокчейном?
Из-за своего специфического характера записи данных блокчейн отлично подходит для тех задач, где требуется высочайшая достоверность и неизменность информации [2]. Например, в сфере информационной безопасности. Технология распределенного реестра обеспечивает целостность и достоверность данных, а благодаря отсутствию единой точки отказа, и стабильность работы информационных систем. Блокчейн может решить проблему доверия к данным, а также предоставить возможность универсального обмена ими
Неизменность и достоверность информационных цепочек блокчейна пригодится при организации автоматического архива операций с данными, в частности, для записи сведений о data pipelines. Это поможет избежать часть самых страшных ошибок Data Scientist на каждой из фаз стандарта CRISP-DM, о которых мы писали здесь.
Аналогично blockchain позволит получать подробные аналитические данные о цепях поставок и потребления, чтобы отслеживать и контролировать потери продукции при транспортировке, например, потери веса вследствие усыхания и испарения некоторых видов товаров
Подобным образом сочетание Big Data и блокчейна можно использовать в здравоохранении, чтобы важные данные о здоровье клиентов медучреждений были максимально защищены, неизменны, проверяемы и не подвержены каким-либо манипуляциям. Также с помощью блокчейна медицинские учреждения смогут обмениваться достоверными сведениями со страховыми компаниями, органами правосудия, работодателями, научными учреждениями и другими организациями, нуждающимися в медицинской информации [4].
Кроме того, децентрализация распределенного реестра позволит устранить посредников и взаимодействовать напрямую с контрагентами, избегая промежуточного буфера, такого как технологический брокер или страховой агент [2].
Блокчейн полезен как дополнительная опция для некоторых Big Data проектов5 примеров успешного совмещения блокчейна с большими данными
- Облачные сервисы хранения больших данных Storj и FileCoin, которые обеспечивают высокую надежность, абсолютную неизменность и защиту данных от несанкционированного доступа. Эти сервисы обещают сократить стоимость хранения данных на 90% по сравнению с подобными решениями от Amazon Web Services’ Cloud [5].
- Omnilytics – система, которая объединяет блокчейн с аналитикой больших данных по маркетинге, финансам, аудиту, прогнозированию тенденций и других приложения в разных отраслях. Пользователи сервиса могут отслеживать свою производительность в сравнении с реальным положением дел у конкурентов и партнеров своей сферы деятельности. Сервис поддерживает smart-контракты, распределенную идентификацию данных, обмен информацией через API и другие протоколы [5].
- Datum – децентрализованная сеть хранения информации, управляемая токеном доступа к данным (DAT, Data Access Token) и предназначенная для монетизации индивидуальных данных [5].
- Rublix – международная торговая платформа для криптовалютных инвесторов, которая проверяет подлинность и авторитет трейдеров, а также предоставляет доступ к рыночной информации, чтобы уменьшить текущую путаницу. Неизменность цепочек блоков гарантирует надежную и проверенную аналитика инвестиционных данных [5].
- Provenance – сервис хранения и предоставления данных о происхождении продукта, предназначенный для потребителей, производителей и продавцов. Клиенты узнают достоверную информацию о том, из чего сделан продукт, откуда он появился и как влияет на окружающую среду. Производители и продавцы отслеживают каждую партию продукции и, по мере накопления данных, получают представление о потребностях и желаниях клиентов, чтобы соответствующим образом адаптировать к ним свои товары и услуги. Блокчейн обеспечивает прозрачность всей цепочки поставок, а средства Big Data – необходимую аналитику [5].
Думаете, как извлечь выгоду от двух самых популярных на сегодня технологий, Big Data и Блокчейн для своего бизнеса? Приходите к нам на занятия, где мы научим руководителей, аналитиков, инженеров и администраторов эффективной работе с большими данными и распределенным реестром. Только практические инструменты и прикладные кейсы, чтобы по завершении обучения вы запустили и успешно реализовали свои собственные бизнес-проекты. Выбирайте курсы по своей специализации, записывайтесь на занятия и приходите в наш образовательный центр!
Источники
- http://kapital-rus.ru/articles/article/blokchein_i_bolshie_dannye_ubut_li_novye_tehnologii_rossiiskie_banki
- https://dis-group.ru/company-news/articles/bolshie-dannye-i-blokchejn-nuzhen-li-blokchejn-dlya-hraneniya-i-obrabotki-big-data/
- https://coinspot.io/technology/hajpovye-pokazateli-i-realnye-skorosti-osnovnyh-kriptovalyut/
- https://forklog.com/big-data-i-blokchejn-proryv-v-oblasti-analiza-dannyh/
- https://www.smartdatacollective.com/6-big-data-blockchain-projects-you-should-know-about/
www.bigdataschool.ru
Искусственный интеллект и блокчейн: идеальная пара | Открытые системы. СУБД
Искусственный интеллект и блокчейн сегодня являются мощными двигателями инновации, которые вносят кардинальные изменения во все аспекты жизни общества и обещают рост глобальной экономики. Будущее уже наступило: появляются автомобили-роботы и вежливые искусственные ассистенты, способные назначать встречи от вашего имени, ведя естественное и вполне осмысленное общение [1]. А с приходом новых платформ взаимодействия участникам больше не придется доверять «ненадежным» посредникам вроде Facebook, Yahoo или Equifax. Каковы же перспективы объединения этих двух технологических направлений?
Искусственный интеллект — это любое задание, выполняемое программой или машиной и требующее наличия «интеллектуальных» способностей. Системы искусственного интеллекта обладают возможностями, которые ассоциируются с интеллектом человека, такими как планирование, обучение, решение логических задач, а также социальные навыки и творчество. Интерес к искусственному интеллекту возобновился сегодня благодаря прорывам в области машинного обучения, в особенности глубинного, а также ввиду бурного роста объемов доступных данных, способствующего повышению эффективности обучения моделей. Появляются разработки наподобие самоуправляемых автомобилей и роботов-курьеров, а вместе с тем растет и беспокойство. У искусственного интеллекта имеются и обратные стороны — от возможности фальсификации новостей с вполне реалистичными снимками, звуко- и видеозаписями [2] до нарушений права на личную тайну [3]. Есть также вопросы в связи с монополизацией мощностей искусственного интеллекта узкой группой игроков, таких как Google, Microsoft и Amazon, препятствующих остальным в получении доступа к данным, специалистам и вычислительным ресурсам.
Развитие блокчейна
Блокчейн — это открытый распределенный реестр, совместно используемый по соглашению всеми пользователями в сети. Записи, например транзакции, хранятся в блоках вместе с хеш-значениями и отметками времени. Каждый блок связан с предыдущим, в результате чего формируется цепочка. Одна из ключевых особенностей блокчейна — неизменяемость: практически отсутствует возможность изменить какую-либо информацию без согласия всей сети.
В зависимости от протокола консенсуса (способа создания блоков), технологии блокчейна делят на две группы. В блокчейнах с доказательством работы (proof-of-work, POW), таких как биткойн и Ethereum, пользователи (майнеры) создают новые блоки путем решения (майнинга) вычислительно сложной задачи. Майнер, получивший право создать блок, получает вознаграждение и плату за транзакцию. Работа по протоколам POW требует больших затрат электроэнергии. Кроме того, майнеры могут подвергаться «атакам большинства», в ходе которых вознаграждение за блок уменьшается; примеры — недавние инциденты с криптовалютами Bitcoin-Gold, Verge, ZenCash и др. В блокчейнах нового поколения используются протоколы на основе доказательства доли владения (proof-of-stake, POS), не требующие энергозатратного процесса майнинга. В них шансы участников на создание блока увеличиваются вместе с числом койнов — принадлежащей им доли. Наиболее известные среди этой группы блокчейнов: Nxt, Peercoin, EOS с делегированным доказательством доли, «клон» биткойна Ouroboros, iChing, а также Algorand — разработанный в МТИ блокчейн на основе POS и алгоритма решения задачи византийских генералов.
Если отбросить нынешнюю шумиху вокруг криптовалют, отвлекающую от реального потенциала блокчейна, соответствующие технологии действительно способны стать основой нового бессерверного Интернета и децентрализованной Всемирной паутины, в которой пользователи получают контроль над своими данными и идентификационными сведениями. Блокчейны обещают переворот в системе здравоохранения — предоставление каждому возможности контроля за использованием своих записей. Более того, имеется вероятность появления более совершенных альтернатив практически любым известным сегодня платформам, включая Facebook, eBay, Uber и Airbnb.
Революционное объединение
Блокчейн имеет немало слабых мест, в том числе с точки зрения безопасности, масштабируемости и эффективности, а искусственный интеллект, в свою очередь, страдает от проблем, связанных с возможностью нарушения приватности, а также с отсутствием доверия и возможности объяснить принцип действия. Объединение этих двух технологий, похоже, неизбежно — они могли бы взаимно дополнить друг друга для создания принципиально нового поколения цифровых систем. Как показано на рисунке, блокчейн избавит от необходимости доверять искусственному интеллекту, обеспечит приватность и объяснимость, а искусственный интеллект позволит строить на базе блокчейна системы машинного обучения, которые будут отличаться усиленной безопасностью, масштабируемостью и более эффективными возможностями персонализации и управления.
Интеграция искусственного интеллекта и блокчейна |
Блокчейн для искусственного интеллекта
Блокчейн может использоваться как основа децентрализованных торговых площадок и платформ координации для различных компонентов искусственного интеллекта, включая данные, алгоритмы и вычислительные мощности. Это могло бы способствовать совершенно новым уровням инновации и масштабов использования искусственного интеллекта. Блокчейн также позволит сделать такого рода решения более прозрачными, объяснимыми и заслуживающими доверия. С учетом того, что все данные в блокчейне общедоступны, искусственный интеллект станет основой для обеспечения защиты от подделки и приватности.
Защищенное предоставление данных
Одной из движущих сил, способствующих развитию искусственного интеллекта, стали огромные объемы данных, потенциально доступные для исследователей, разработчиков и коммерсантов. Данные — «золото» цифровой экономики, но доступ к ним преграждают высокие барьеры. Во-первых, может быть непросто получить достаточный объем данных для ваших моделей обучения, если вы не работаете на кого-то из онлайн-гигантов вроде Facebook или Google. В связи с этим существенно ограничивается конструктивная конкуренция между исследователями. Во-вторых, растут проблемы приватности — уже сегодня немало случаев утечки и злоупотребления личными данными. Вспомнить хотя бы недавний скандал с Facebook, когда данные 50 млн пользователей социальной сети собирались без их согласия компанией Cambridge Analytica. «Ужасает, что некие группировки могут, выясняя страхи и предпочтения пользователей, склонять их к той или иной точке зрения и подталкивать к тому, чтобы они пропагандировали эту точку зрения среди единомышленников», — так прокомментировал ситуацию в блоге специалист по безопасности Университета Мэриленда.
Блокчейн обеспечивает прозрачность и учитываемость данных, позволяя выяснять, к каким именно пользовательским сведениям происходил доступ, когда и кто к ним обращался. Поскольку блокчейн возвращает людям контроль над данными, пользователи смогут делиться ими с большей уверенностью, зная, что данные будут без нарушений задействованы для персонализации или иных полезных применений. Врачи и ученые смогут получать доступ к огромным объемам анонимизированных медицинских записей, существенно ускоряя поиск лекарств и разработку новых методов лечения и медицинских процедур. Появится больше надежды у пациентов с редкими заболеваниями, поскольку врачи смогут изучать данные по аналогичным случаям по всему миру, и отчасти эта идея уже начинает воплощаться.
Ваши данные — ваша цена
Помимо контроля над вашими данными и возможности ими делиться, блокчейн-технологии позволят продавать их с помощью умных контрактов, открывая перспективу для создания торговых площадок, более защищенных и приватных ввиду отсутствия посредников. Такие площадки сократят мелким игрокам число барьеров для вхождения на рынок, выравнивая игровое поле и тем самым способствуя развитию инноваций. Используя протоколы доказательства с нулевым разглашением, предприятия и исследователи могли бы находить нужную информацию, не зная подробностей о данных и личности их владельцев. Возможность обнаружения и фильтрации необходимых данных с сохранением приватности пользователей очень важна. Вероятно, благодаря этому даже начнется новый виток эволюции искусственного интеллекта. К примеру, стартап Nebula Genomics уже предлагает торговую площадку, которая соединяет людей, желающих пройти секвенирование своего генома, и организации, которым нужны эти данные. А в компании Longenesis разработали платформу, позволяющую за деньги делиться медицинскими данными, в том числе историями болезни, сведениями о симптомах и т. п.
Продажа неиспользуемых вычислительных мощностей
Блокчейн даст возможность задействовать больше распределенной вычислительной мощности для искусственного интеллекта в рамках децентрализованного рынка — облаков. Разработчики могут использовать миллионы графических процессоров, находящихся в собственности геймеров, для подготовки, моделирования, обучения и развертывания алгоритмов машинного обучения. Геймеры, чьи видеочипы используются в играх лишь какую-то долю времени, могут с помощью умных контрактов выставлять машинное время на продажу.
Идея продажи незадействованной вычислительной мощности не нова, достаточно вспомнить некогда популярную технологию гридов. А вот рынок облачных сервисов с функциями искусственного интеллекта имеет массу возможных применений — всех, на которые только способен искусственный интеллект. Стимулирование в виде оплаты криптографическими токенами будет побуждать растущее число пользователей продавать свои вычислительные ресурсы.
Координация работы не доверяющих друг другу устройств
Большие перспективы у искусственного интеллекта имеются для управления устройствами, не доверяющими друг другу. Группы робототехнических устройств, субъекты Интернета вещей и различные носимые устройства могут теперь координировать свои действия и принимать коллективные решения. В подобных сценариях блокчейн служит платформой координации, безопасность которой злоумышленники могут скомпрометировать только в том случае, если захватят контроль над большинством устройств. Здесь открывается большое поле применений — от обновления «прошивки» холодильника до координации действий групп боевых роботов. Правда, этот же принцип может использоваться и для управления ботнетами. Сейчас специалисты по безопасности способны отключать ботнеты сразу после обнаружения их центров управления, но если эту единую точку отказа заменить на блокчейн, так просто решить задачу уже не удастся.
«Объяснимый» искусственный интеллект
Несмотря на успешное применение машинного обучения в разработке автономных систем, способных воспринимать информацию, обучаться и самостоятельно действовать, поле его практического использования расширяется не слишком быстро. Одна из причин — трудности объяснения того, какие именно процессы происходят при обучении. Решения, принимаемые этими системами, не поддаются строгому объяснению, а потому их нельзя проверить и доверять им. С еще большей опаской на искусственный интеллект смотрят в медицине и финансовом планировании, где особенно важна объяснимость, в связи с тем что неверное решение может привести к серьезным последствиям. Поэтому важно было бы иметь неизменяемую запись, позволяющую прослеживать перемещения данных и все действия сложных систем на основе искусственного интеллекта.
Именно такую возможность — зарегистрировать все «изгибы» цепочки обработки данных на пути к решению — и дает блокчейн. Отслеживая поведение систем с искусственным интеллектом при обработке различных входных данных для разных задач, можно получить более точное понимание решений, которые принимаются этими системами, и больше им доверять. При этом людям гораздо проще будет получать обоснования решений, принимаемых машиной, путем просмотра подробного журнала, описывающего процесс. Кроме того, такие записи помогут оптимизировать «черные ящики» искусственного интеллекта, соблюдая баланс между производительностью, точностью прогнозов и объяснимостью. А при расследовании инцидентов след, зафиксированный в блокчейне, позволит установить виновного.
Искусственный интеллект для блокчейна
Разработка и эксплуатация блокчейна требуют настройки тысяч параметров и компромиссов между безопасностью, производительностью, децентрализованностью и т. п. Искусственный интеллект может облегчить принятие соответствующих решений, автоматизировав и оптимизировав работу блокчейна для более высокой производительности и улучшенного контроля. А с учетом того, что все данные в блокчейне общедоступны, искусственный интеллект будет играть ключевую роль в обеспечении конфиденциальности и приватности пользователей.
Безопасность и масштабируемость
Если злоумышленник не владеет большей частью ресурсов майнинга, взломать блокчейн практически невозможно, однако приложения, построенные на платформе блокчейна, к сожалению, не настолько защищены. Например, The DAO, одна из крупнейших краудфандинговых платформ, владеющая криптовалютой Ether на 150 млн долл., стала жертвой хищения 50 млн долл. Взломщик использовал ряд ошибок, допущенных при составлении умных контрактов, что позволило выполнить повторные транзакции и изъять больше денег, чем вложил по контракту фонд. Учитывая стремительный прогресс машинного обучения, блокчейн, работающий под управлением интеллектуального алгоритма, вполне мог бы обнаружить факт атаки и автоматически включить защитные механизмы. А если ущерб неизбежен, искусственный интеллект мог бы по меньшей мере изолировать атакуемый компонент от остальной части блокчейн-платформы. Управляя блокчейном, он мог бы улучшать масштабируемость и повышать надежность распределенного реестра. Например, при резком увеличении объема транзакций искусственный интеллект мог бы автоматически увеличить скорость создания блоков, что позволило бы увеличить пропускную способность по цене увеличенного времени подтверждения.
Приватность и персонализация
Если вы боитесь, что очередные выборы будут скомпрометированы, или беспокоитесь за безопасность своих данных в социальных сетях, блокчейн — это для вас: он сможет вернуть контроль над личными данными. Но за это придется заплатить. В традиционных централизованных системах вроде Facebook, Netflix и YouTube собранная пользовательская информация анализируется для персонализации контента. Именно благодаря этому, заходя в Facebook, вы видите посты от друзей, с которыми чаще общаетесь, или, открывая Netflix, видите фильмы, соответствующие вашему вкусу. Возвращение приватности означает, что никто не будет знать ваших вкусов и вам, возможно, придется проматывать многие страницы в поисках релевантного контента, не рассчитывая на участие системы автоматизированного подбора. Но нельзя ли обеспечить одновременно и приватность, и персонализацию?
На помощь может прийти искусственный интеллект — с новой моделью отбора контента. Децентрализованный провайдер контента, например социальная сеть на базе блокчейна, мог бы использовать искусственный интеллект для персонализации выдачи на стороне пользователя. Система машинного обучения выполняется на устройстве пользователя, анализируя сведения о просмотренных им сайтах. Релевантный контент в этом случае будет загружаться самим пользовательским устройством, а не «навязываться» сервером. При этом все вычисления будут выполняться локально — личные данные не будут покидать устройство пользователя. Более того, можно выполнять «санацию» контентных предпочтений пользователя, чтобы не позволить провайдерам профилировать контент. Таким образом, подобная модель одновременно обеспечивает и приватность, и персонализацию.
Восстание машин
Сюжет с восстанием машин, берущих под контроль все аспекты существования человека, уже давно навяз в зубах, однако подобное будущее уже наступает, по крайней мере отчасти. В блокчейнах заключаются «умные» контракты, которые управляют деловыми отношениями между пользователями, решая, кто из них должен получить оплату. Правда, пока что они не такие уж и «умные» и справляются лишь с достаточно простыми условиями. Но уже скоро искусственный интеллект сможет выступать в роли арбитра в более сложных ситуациях. Со временем пользователи смогут разрешать конфликты, происходящие как внутри распределенного реестра, так и вне его, не обращаясь в суд, — получив свидетельства и необходимые документы, искусственный интеллект мог бы выполнить автоматический арбитраж без предубеждений и возможности влияния на этот процесс. Все решения принимались бы на основе данных, а значит, были бы более последовательными и обоснованными.
***
Несмотря на стремительный прогресс искусственного интеллекта и блокчейна, им предстоит еще долгий путь развития. Из новейших разработок в области искусственного интеллекта можно отметить Google Duplex — систему, способную автоматически делать телефонные звонки от вашего имени. Правда, пока она предоставляет только три возможности: бронирование столиков в ресторанах, запись в салоны красоты и выяснение часов работы магазинов. И, несмотря на колоссальные прорывы в области алгоритмов и данных искусственного интеллекта, до сложности человеческого разума ему все еще далеко. А что касается блокчейна, то недавние инциденты безопасности с Ethereum, ZCash, Bitcoin Gols и многими другими криптовалютами говорят о том, что пройдет еще немало времени, прежде чем появятся защищенные масштабируемые блокчейны для реальных применений. Тем не менее в будущем пара «блокчейн — искусственный интеллект», безусловно, способна обеспечить обществу массу возможностей.
Литература
- Y. Leviathan. Google Duplex: An AI System for Accomplishing RealWorld Tasks Over the Phone. 8 May 2018, Google AI Blog. URL: https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html (дата обращения: 21.11.2018).
- A. Hern. AI Used to Face-swap Hollywood Starts into Pornography Films. 25. Jan 2018, The Guardian. URL: www.theguardian.com/technology/2018/jan/25/ai-face-swap-pornography-emma-watson-scarlett-johansson-taylor-swift-daisy-ridley-sophie-turner-maisie-williams (дата обращения: 21.11.2018).
- J. McGrath. A.I. Will Make Smart Homes Autonomous, But Don´t Expect Perfection or Privacy. 8 June 2018, Digital Trends. URL: www.digitaltrends.com/home/ai-will-make-the-smart-home-autonomous-but-dont-expect-perfection-or-privacy (дата обращения: 21.11.2018).
Танг Динх ([email protected]) — доцент, Университет Вирджинии; Ми Тай ([email protected]) — профессор, Университет Флориды.
Thang N. Dinh, My T. Thai, AI and Blockchain: A Disruptive Integration, IEEE Computer, September 2018, IEEE Computer Society. All rights reserved. Reprinted with permission.
Поделитесь материалом с коллегами и друзьями
www.osp.ru
Что значат эти термины? (дополняется) — МирДоступа
Цифровая экономика всё ближе, поэтому нам с вами как следует подготовиться к её приходу. Здесь собраны термины, которые подавляющее число IT-специалистов употребляют в речи, а нам ничего из этого не понятно.
Поиск по статье:
Аджайл (Agile)
Скрам (Scrum)
Спринт
Асессмент дэй
Биг Дата
Брейнстормить
Бэклог
Блокчейн
Бустануть
Варчест
Вука (VUCA)
Гудвилл
Деплой
Дата Майнинг
Дашборд
Закоммитить
Знай своего клиента (KYC)
Засуспендили
Индустрия 4.0
Инцидент менеджмент
ИТ-ландшафт
Кастомизация
Кастомер Джорней
Кейтеринг
Кей Вижуал
Кибербуллинг
Киллер фича
Клиффхэнгер
Криптоджекинг
Кросс бордер
Кобраузинг
Консолидировать
Коллтрекинг
Комплаенс
Коучить
Лэрдж скейл (Скрам)
Лукалайк (look a like)
Машинное обучение
Маccфоловинг
Продакшн
Превентивная защита
Приложения PWA
Песочница
Релокейт
Рефакторинг
Рефербишмент
Ресёрчер
Рокет сайнс
Ролл аут
Софт скиллз
Сущность
Сэлф-драйвинг
Сеттинг
Схема as is
Тайм ту маркет (TTM)
Тонкий клиент
Трекать
Уберизация (услуг)
Форсайт, форсайт-сессии
Фронт (фронт-энд)
Фреймворк
Фулл-стэк
Хейтспич
Шардинг
Шерить (документы, файлы)
Agile / Аджайл (Эджайл, работать по эджайлу)
Agile software development, agile-методы
— серия подходов к разработке программного обеспечения, опирающихся на использование динамичной, итеративной разработки (короткими 1-2 недельными циклами, спринтами). Разработка по методам Аджайл — это когда команда профессионалов, равных друг перед другом (нет начальников) нацелена на максимально быстрый результат. Под результатом понимается выпуск работающего продукта в максимально короткие сроки (пусть даже с урезанным функционалом). При разработке команда опирается не только на свои знания, но и на пожелания клиентов, на отзывы людей, которые пользуются промежуточными релизами продукта.
Аджайл — это НЕ методология
Аджайл — это собирательное название подходов к управлению и набор принципов разработки, т.е. методологией назвать это нельзя.
Аджайл — это НЕ инструкция
Инструкция даёт конкретные указания для достижения результата. Аджайл — нет.
Аджайл — это философия
Определенная культура и гигиена разработки любого продукта (приложения, сервиса и т.д.). Как и в любой другой философии, у Agile есть свои основные постулаты, которые описаны в специальном документе — Аджайл Манифест. Быть аджайл — это значит принимать эти основополагающие принципы.
Есть ли минусы у Аджайл?
- Agile подразумевает высокую скорость разработки, что не всегда гарантирует стабильность продукта, особенно на ранних этапах, когда готовы только отдельные части программы, а не приложения в целом.
- Данная философия требует высокой самоорганизованности от каждого члена команды. Однако, некоторые, даже опытные, работники не могут «сходу» привыкнуть к работе без начальства, без подробного технического задания и т.д.
- Для организации процессов разработки по Аджайл необходим сильный Product Manager (Владелец продукта), который видит цель и полностью представляет себе, каким должен быть конечный результат (работающий продукт).
Как конкретно помогает Agile в разработке?
Понятие всей команды разработки о её целях.
Agile-методы позволяют каждому в команде знать конечную цель разработки и все пожелания клиента, даже какую бы роль в проекте ты не выполнял. Ведь когда знаешь, что в итоге должно получиться — это сильно помогает сфокусироваться
Сведение к минимуму бюрократии и регламентов
Простота в философии Аджайл играет особую роль. Подразумевается, что оргпроцессы внутри команды максимально прозрачны, помогают отбросить в сторону правила, бумаги, волокиту и сосредоточиться на созидании.
Работа короткими циклами
Суть в том, что разработке ведется фиксированными отрезками времени (1-2-4 недели). В начале каждого такого «спринта» задаются краткосрочные цели. В конце — подводится итог данного отрезка. Важность в том, что каждый спринт, вне зависимости от продолжительности, заканчивается релизом продукта. Даже с самым минимальным функционалом, главное, чтобы им можно было пользоваться.
Участник команды может расширить свои полномочия при необходимости
Брать решение вопроса или проблемы на себя — один из основополагающих принципов Agile-разработки. Таким образом, каждый сотрудник не только может почувствовать себя важным звеном в разработке, но и научиться ответственности за свои решения, что в дальнейшем послужит хорошую службу дальнейшим проектам.
Как применить Аджайл на практике?
Чтобы применить философию на практике, используют так называемые фреймворки. Самый популярный из них — Скрам. Фреймворк — это набор уже готовых правил, которые показывают, как организовать рабочий процесс по Аджайлу. Фреймворк помогает теорию Аджайла перенести в практическую плоскость и применять на своих проектах.
Скрам (Scrum)
Скрам — это фреймворк, набор элементов, решений рабочего процесса. Аджайл — теория, философия. Скрам — практика, правила, в которых описано что и в каком порядке необходимо делать.
Многие считают, что Скрам — это неотъемлемая часть Аджайл. Это правда — связка Scrum+Agile, на данный момент, самая популярная в плане организации процесса разработки.
Скрам подразумевает работу короткими циклами, называемыми итерациями. Важная особенность разработки по скраму — в конце каждого цикла команда должна выдать работающий продукт, который должен иметь хоть какую-то функциональность. Т.е. каждый цикл — это добавление новых функций, улучшение продукта.
Что подразумевается под продуктом?
Продукт — это то, что приносит прибыль клиенту. Под продуктом можно подразумевать всё, что имеет функциональность, бизнес-модель, свою идею и её реализацию. Это может быть как материальный (физический) объект — автомобиль, кружка, бумажный самолетик Telegram, так и цифровым сервисом, мобильным приложением (программное обеспечение, игры) . С некоторыми нюансами продуктом можно считать предоставление услуги (консультации, уход за домашними животными, клининг и т.д.)
Особенности работы в Скрам
Главная составляющая в Скрам — это спринты. Так называются рабочие циклы, длительностью от одной недели до одного месяца.
Команда — набор специалистов разных областей. Вся команда ответственна за результат — конкретного виноватого при провале никогда нет. Взаимная помощь и работа сообща внутри коллектива — один из столпов Скрама. Так же нет цепочки «Начальник» -> «Подчиненный» — все равны перед друг другом. Расширение компетенций — нормальная практика
План и процесс разработки — плавающий. В конце каждого спринта идёт обсуждение, корректировка задач и рабочего процесса. Всё это идёт для улучшения работы в следующем спринте
Документирование процесса — минимальное. Как и следует из идеологии Аджайл — все силы кидаются на разработку, избавляя команду от бумажной волокиты и сведение к минимуму остальной бюрократии
Владелец продукта. Кто это и зачем нужен?
Как мы уже выяснили выше — в Scrum-команде нет начальников. Но всё же есть один человек, который полностью отвечает за результат — это Владелец продута (Product Manager / Product Owner). Важно понять, что этот человек — не руководитель и не начальник. Но именно он определяет конечную цель, ставит задачи перед командой, корректирует курс разработки. Его роль можно обозначить как Тимлид (Team Leader) — он ведет проект от начала и до конца, он знает, какой результат нужен клиенту. Для того, чтобы направить команду в нужное русло Владелец продута создает Бэклог продукта (значение см. ниже)
Артефакты. Что это?
Scrum-метод подразумевает использование командой так называемых Артефактов. Всего их три — Бэклог Продукта, Бэклог Спринта и Инкремент Продукта. Всё это необходимо для правильного вектора в разработке продукта и упрощению по его созданию в целом.
Бэклог Продукта
Это список функций, отсортированный по релевантности и приоритету, которыми должен обладать продукт. Составляет Владелец Продукта с учетом мнения клиента. Т.е. фактически это полноценная карта развития продукта, редактируемая с учетом изменений, пожеланий и изменений в процессе разработки.
Бэклог Спринта
Спринт — рабочий цикл. Бэклог спринта — список задач на данный конкретный цикл, т.е. что будет сделано в эти 1-4 недели для создания/улучшения продукта. Для каждого цикла создается новый бэклог.
Инкремент Продукта
То, что команда «насоздавала» в конце спринта называется Инкрементом Продукта. Его показывают заинтересованным людям, клиентам и собирают отзывы, чтобы обозначить дальнейшее его развитие. Готовность продукта определяют по специальным критериям готовности
Критерии готовности
Команда разработки определяет специальные критерии готовности. Эти критерии команда определяет сама. По-простому, это список того, что нужно сделать в спринте, чтобы можно было сказать в его конце — Продукт работает (либо Продукт готов).
Что такое «Скрам-доска»?
Скрам-доска — импровизированная доска с задачами на текущий спринт с карточками. Всего в ней три колонки: «Сделать», «В работе» и «Готово». С каждым новым спринтом все карточки убираются и процесс повторяется.
Спринт (скрамовский спринт)
Спринт —
это рабочий период (цикл) от одной недели до одного месяца за который команда разработки создает продукт, часть продукта, улучшает существующий функционал продукта и т.д.
Каждый спринт — своего рода мини-проект. За один спринт команда должна показать — вот это мы создали, это докрутили, это изменили. В следующем спринте мы сделаем это, это и вот это.
Суть разработки по спринтам в том, что можно добавлять в продакшн пусть и небольшие, но стабильные изменения и расширения функционала. Результат работы, в любом случае, должен быть виден.
Для каждого нового спринта готовится скрам-доска для визуализации процесса работы. Это делает разработку и более понятной — всегда знаешь, кто над какой частью работает в данный момент
Что дает разработка спринтами? Каждый спринт (цикл) дает возможность редактировать продукт, его функции, конечный результат «на ходу». Это может быть связано с изменением конъюнктуры рынка или балаьным пожеланием клиента. Спринт — прозрачный процесс. Абсолютно каждый знает конечную цель, цель промежуточного этапа (того же спринта). Каждый знает свою роль и задачи, которые четко расписаны по времени.
Каждый Спринт состоит из пяти событий: Планирования Спринта, Ежедневного Скрама, разработки, Обзора Спринта и Ретроспективы Спринта.
Планирование спринта.
Планирование спринта производится в начале каждого. На нам обсуждается план действий на текущий спринт, объем работ. Самое главное — выбирается цель спринта и составляется его бэклог (задачи, которые нужно решить в данном цикле).
Ежедневный Скрам
Каждый день проводятся 15-минутные встречи, на которых команда оценивает, как продвигается работа и синхронизирует планы на ближайшие сутки. Такая «планерка» нужна, чтоы каждый член команды понимал, куда будет двигаться разработка продукта на ближайшие 24-часа. Совещание принято не затягивать более 15 минут.
Разработка
Разработка — это непосредственно сам процесс создания продукта в текущем спринте. Результатом должен стать инкремент продукта
Обзор Спринта
Обзор спринта — это открытая презентация перед всеми заинтересованными лицами — командой разработки, пользователями, другими сотрудниками компании. Демонстрация включает в себя не только рассказы или презентации — на обзоре спринта обязательно должен быть Инкремент продукта (кто забыл — промежуточный релиз, который команда создала/улучшила за спринт).
Все желающие могут его запустить, проверить, протестировать, собрать, потрогать. Самое главное на данном этапе — получить обратную связь от, непосредственно, конкретных пользователей и стрейкхолдеров (заинтересованные в продукте лица, инвесторы, клиенты — их обратная связь особенно важна для команды). Они делятся впечатлениями, высказывают мнение, подчеркивают плюсы и минусы продукта. По результату возможно внесение изменений в Бэклог Продукта.
Ретроспектива спринта.
Подведение всех итогов спринта. Обсуждение в свободном формате событий, удачных и провальных решений с целью улучшения и модернизации рабочего процесса и взаимодействия внутри команды в следующем спринте. Обычно длится не более 3 часов
Далее по алфавиту
Ассессмент дэй
День, который ты практически полностью посвящаешь собеседованиям и тестам на территории работодателя
Биг Дата (Биг дейта, Big Data)
Буквально данный термин переводится, как «большие данные». Но суть его не в самом количестве, а в методе анализа обработки, хранения, распределения больших, требующих огромных вычислительных мощностей для этих самых данных. Big Data — аккумуляция больших массивов информации. Для примера можно привести один из проектов цифровой экономики, которая начнет реализовываться в России со следующего года. Электронное здравоохранение — данные по пациентам (электронные карточки), телемедицина и другие сервисы потребуют хранения и обработки огромного количества данных, где как раз пригодится данная технология.
Совокупность инструментов и подходов системы Big Data подразумевает собой моментальную масштабируемость в зависимости от общей нагрузки (объемов данных) в реальный момент времени. Также одним из принципов технологии является высокая отказоустойчивость с помощью физических серверов, балансировки нагрузки, распределенного кэширования и так далее.
Брейнстормить
Совместный поиск решения какой-либо задачи несколькими специалистами. Считается, что брейнсторм позволяет организовать более продуктивный анализ и найти быстро решение. Проще говоря, более эффективен, чем работа каждого из экспертов по отдельности.
Бэклог
Это упорядоченный список требований к работе продукта или системы (use-case), которые должны быть в них реализованы разработчиками. Бэклог — это полноценный журнал, где часто описана вся история разработки, сценарии, будущие пожелания к продукту. Обычно задачи распределены по степени важности (Importance). При этом он не только задаёт приоритизацию, но и позволяет её менять в реальном времени, делать срезы и отчеты по отдельным компонентам и т.д.
Блокчейн
Блокчейн (blockchain — «цепочка блоков») — это последовательная цепочка блоков, в которых заложена любая информация, которая не может быть изменена, т.к. данные находятся у всех участников системы одновременно. Этакое большое хранилище данных, где каждый знает о каждом в пределах этой системы. Самый популярый пример — биткоин. В блокчейне содержится записи абсолютно всех транзакций — сумма, отправитель, получатель, у кого сколько денег (биткоинов) сейчас на кошельке — абсолютно прозрачная финансовая система по технологии Blockchain. Таким образом, даже одну такую транзакцию подменить или удалить нельзя, ведь она записана на каждом из миллионов компьютеров.
Бустануть
Бустануть (от англ. boost — увеличить) — придать максимальный приоритет задаче или чему-либо, существенно повысить его. Речь может идти как про физические метрики — скорость, отдача, так и носить эмоциональный окрас — чувство, желание и т.д.
Варчест
Варчест — это финансовая подушка безопасности. Обычно используется для ситуации в компании, которая требует гораздо большей готовности или денег, чем обычно, либо необходимо срочно «влить» деньги в платный маркетинг и т.д.
ВУКА/VUCA (среда, стратегия)
VUCA — это акроним английских слов volatility (нестабильность), uncertainty (неопределенность), complexity (сложность) и ambiguity (неоднозначность). В IT стратегия развития VUCA означает, что бизнес-процессы могут адаптироваться под быстро меняющиеся условия рынка, а руководители знают, в каком направлении развиваться компании, даже с учетом неопределенности. Особенно это касается сферы высоких технологий, где изменения происходят быстрее всего.
Гудвилл (нарабатывать гудвилл)
Так обозначается показатель престижа и деловой репутации.
Деплой
Развертывание кода приложения на продакшн сервер для его запуска. Соответственно, Деплой сайта — это «залив» его рабочей версии на хостинг с последующим развертыванием, разархивированием файлов, установкой базы данных и т.д. и т.п. Деплой мобильного приложения — развертывание его в смартфоне.
Дата Майнинг / Data Mining
Фактически, переводится как «Добыча данных». За основу в дата майнинге взяты различные методы прогнозирования, моделирования и аналитики некоего массива данных. Суть заключается именно в аналитике больших данных для исследования, распознавания с целью выявления определенных закономерностей и систематических взаимосвязей — а это, в свою очередь, позволяет получать новые данные. Цель — извлечь знания для принятия решений в условиях неопределенности
Хорошие пример использования можно найти в фармацевтике — именно Data Mining-технологии позволяют анализировать взаимодействие лекарственных средств друг на друга. Если учесть, что каждое лекарство имеет свои побочные действия, то их наложение друг на друга могут принести колоссальный вред организму. Поэтому такого рода исследования очень важны в современном здравоохранении. Так же Data Mining применяется для реализации масштабных аналитических проектов в бизнесе, маркетинге, интернете, телекоммуникациях, промышленности, геологии и других областях
Дашборд / Dashboard
Чаще всего используется в значении «Панель мониторинга» (Приборная панель). Используется для отображения особо критичной информации о каком-либо процессе, либо инструменты для получения этой информации. Часто отвечает на вопрос «Что нового?». т.к. дашбоард может содержать в себе виджеты, которые обновляют данные (диаграммы, графики, обновляемые таблицы статистику, например) в реальном времени. В общем, дашбоард — стартовый экран со статической или обновляемой информацией, которая интересна или критична в данный момент.
Закоммитить
Имеет множество значений, но основное — зафиксировать изменения (в конфиге, в коде)
Знай своего клиента (KYC — Know Your Customer)
Данный термин применяется в банковской среде и означает, что любой банк должен подтвердить личность клиента (провести идентификацию), прежде чем совершать финансовую операцию. Считается, что такая практика препятствует отмыванию денег, финансированию терроризма и уклонению от уплаты налогов.
Засуспендили
Данный термин используется в значении «Забанили» (на сайте, форуме, чате и т.д.) От английского Susspend — приостановить, временно прекращать.
Индустрия 4.0
Общее название современных технологий, внедряемых в производство, которые затрагивают все сферы человеческой деятельности с целью повышения качества жизни людей и получения экономического эффекта. Сюда можно отнести Big Data, IoT, VR, роботизацию, искусственный интеллект, кибербезопасность и так далее.
Инцидент менеджмент / Incident Management
Дословный перевод — Управление инцидентами. Данный бизнес-процесс направлен на снижение времени для обнаружения, идентификации и решения инцидентов, которые могут повлиять или уже непосредственно влияют на предоставление услуги и увеличение её отказоустойчивости. Такая критичность часто применима к компаниям, которым чревата каждая минута простоя (например, интернет-провайдер). Особое внимание уделяется хронологии, описанию симптомов, распределение ответственных и самое главное — временным рамкам (SLA). Также данный термин часто упоминается в варианте ITIL (Problem Management).
ИТ-ландшафт
Под ландшафтом подразумеваются абсолютно все типы ресурсов — технические, вычислительные, программные. Грубо говоря, это фундамент, который содержит в себе полный набор инструментов, средств, методов обработки данных для работы вашей компании в информационной среде. Т.е. он может состоять одновременно из почтового или HTTP-сервера, программного обеспечения по бухгалтерской отчетности, мониторингу или контролю сетевого оборудования, нормативно-справочной информации, систем виртуализации, аппаратными фаерволами, серверами с RAID-массивами и так далее. Самое главное, что IT-ландшафт — это полностью автоматизированный «организм», который позволяет всем этим системам обмениваться данными, быть одним целым.
Кастомизация
В широком смысле — это продукция, заточенная под конкретного покупателя. В этом продукте можно изменять какие-либо параметры, которые может «подкрутить» каждый её пользователь, подгоняя под свои нужны. Также кастомизация может сказываться на упаковке, комплектации, дополнительными бонусами. Таким образом, у покупателя появляется приятное чувство, что массовый продукт сделан специально под него.
Кастомер Джорней (Customer Journey, Клиентский опыт)
Это, так называемый, путь клиента. Путь от мысли о покупки вашего товара или услуги до её покупки и потребления. Для анализа каждого этапа создается карта — Customer Journey Map. Благодаря ей, можно понять прихоти и мысли клиента: что он чувствует, что видит, что слышит, что хорошего происходит, что плохого и как это можно улучшить на каждом отдельном этапе. Стандартный пример кастомер джорней:
- Клиент задумывается о покупке или появилась нужда в его приобретении
- Гуглит товар в интернете, читает отзывы
- Попадает на ваш сайт
- Находит товар, читает обзор, характеристики
- Оплачивает товар
- Ждет доставку, забирает его сам
- Использует товар
Кейтеринг
Доставка еды для сотрудников какой-либо организации на постоянной основе, либо на отдельные мероприятия. Используется, в основном, для доставки питания в удаленные точки, где нет возможности или нецелесообразно готовить пищу на месте. Может включать в себя не только курьерскую доставку, но и полное обслуживание (оформление, услуги официантов, сервировка столов и так далее)
Кей вижуал (Key visual, ключевой рекламный образ)
Вся суть кейвижуала — это запомнится потребителю с помощью одной картинки, выделить эмоционально, подчеркнуть стиль и элементы айдентики (фирменного стиля) в презентации, видео-ролике или в любом другом формате рекламы.
Кибербуллинг
Таким термином обозначают приставание в интернете с целью последующего шантажа. Жертвой кибербуллинга часто становятся одинокие мужчины, которые знакомятся в интернете. Мошенники, представлясь 14-15-16-летними девушками заводят знакомство, разговор который через некоторое время переходит в разряд откровенных. После чего начинается обмен фотографиями «взрослого» содержания. И теперь самое интересное — «девушка» начинает угрожать собеседнику, что подаст на него в полицию и/или скинет переписку жене, друзьям, родственником. В обмен на молчание мошенники просят определенную сумму денег. Это и называется кибербуллинг — шантаж в интернете.
Киллер фича
Так называют функционал программы, который делает её уникальной и выделяет среди конкурентов. Киллер фича — это та самая «изюминка», которая заставит пользоваться именно этим приложением или решением
Клиффхэнгер
Это самый, пожалуй, известный художественный приём в кинемотографе, когда эпизод/серия/сезон обрывается в самый интересный момент, оствляя кучу вопросов, недосказанностей и сохраняя интригу до следующего момента или серии. Яркий и современный пример можно привести с сериалом «Игра престолов», где каждая серия заканчивается типичным клиффхэнгером, что заставляет зрителей ждать следующей с большим нетерпением
Криптоджекинг
Способ добычи криптовалюты через сайт за счет его посетителей. Специальный вредоносный код позволяет использовать мощности пользователей сайта для майнинга криптовалюты. Заходя на такие сайты, посетитель может заметить увеличение нагрузки на CPU.
Кросс бордер (Cross Border)
Трансграничная торговля (форма торговли, при которой товары перемещаются с таможенной территории одной страны на территорию другой). По этому принципу работают все известные онлайновые маркет плейсы — eBay, Amazon, Aliexpress.
Кобраузинг (Co-browsing)
Кобраузинг — технология, которая позволяет оператору онлайн-чата использовать браузер клиента, чтобы помочь ему совершить какое-то действие (зарегистрироваться, купить товар, найти описание или любое другое)
Консолидировать
Объединить какую-либо информацию в один целый результат. Консолидировать исходные данные — собирать нужную информацию из различных источников. Консолидированное решение — общее решение
Коллтрекинг
Это технология, отслеживающая с какого рекламного канала (оффлайн, сайт и т.д.). Т.е. для оффлайн рекламы закрепляется свой номер, а на сайте — другой (возможно сделать даже отдельный номер для каждого отдельного пользователя). Это помогает понять откуда к вам идут покупатели и какая из рекламных моделей больше эффективна.
Комплаенс
Данный термин дословно означает соответствовать или подчинятся. Речь идёт о правовом подчинении. Комплаенс — это внутренний контроль за соответствием деятельности предприятия законодательству. Его главная цель – исключить риски потери прибыли. К ним относятся штрафы, выплаты ущерба или невыполнение контрактов.
Коучить
Означает «Обучать».
Лэрдж скейл скрам (Large-Scale Scrum)
От обычного скрама отличается бОльшим масштабом — над продуктом работает сразу несколько команд, но работают они по главному принципу эджайла — все команды (называемые feature-team) делают не какую-то часть, а цельный продукт
Лукалайк (Look a like)
Данным термином обозначается специальный алгоритм таргетинга рекламы на узкую целевую аудиторию. Дословный перевод «Похожий» означает, что эта целевая группа пользователей выбирается из расчета похожих интересов, действий на сайтах (поведенческих факторов), поисковых запросов. Получается очень такой локальный таргетинг, но именно такой подход позволяет подобрать максимально целевой трафик.
Машинное обучение (Машин лёрнинг / Machine Learning)
Это новое ответвление инженерии, дисциплина, использующее алгоритмы, которые, в свою очередь, позволяют искусственному интеллекту учиться. Есть несколько методов машин лёрнинг. Supervised Learning — «обучение с учителем». Вводные данные представляют собой пару, типа «что происходит» — «как реагировать» . Reinforcement Learning — Машина постепенно учится правильно реагировать на предоставленные ей данные, анализируя прошлый опыт Стандартная методика, которую использовали в разработке анти-спам решений. Unsupervised Learning — самообучение. Человек не участвует в принятии решений, корректировке алгоритмов и т.д. Самый сложный метод Machine Learning
Маccфоловинг
Массовый набор подписчиков для профиля в социальной сети (особенно популярно в Инстаграме). Обычно для этого используются специальные платные и бесплатные сервисы
Продакшн (отдавать в продакшн)
Основной сервер, где располагаются все рабочие версии приложений, сайтов и т.д. Предварительно все приложения проверяются («обкатываются») в тестовой среде, только после этого попадают в продашкн
Превентивная защита
Превентивная защита у антивирусов работает на предупреждение. Само слово это и означает — предупредительный, опережающий. Подобная защита поможет отслеживать подозрительные действия приложений, драйеров или процессов операционной системы для предотвращения атаки заранее.
Приложения PWA (Progressive Web App)
Технология PWA — это новый стандарт разработки приложений для мобильных устройств. Суть в том, что прогрессивное веб-приложение сочетает в себе простоту использования и интерфейс мобильного сайта, но в тоже время содержит элементы «настоящего» нативного приложения (push-уведомления, GPS и другое). По сути, это гибрид, который взял плюсы с одной и с другой стороны, соединив их в один продукт. Разработка таких приложений гораздо легче, тем более, что для PWA магазины, вроде Google Play и App Store не нужны. Таким образом, между цепочкой разработчик-пользователь теперь нет посредников. Для последних это тоже плюс — нет больше надобности устанавливать кучу приложений в телефон, занимая память. PWA не требует установки. В силу привычки пользователей и для удобства, на рабочем столе такие приложения выглядят как обычные, установленные в телефон.
Песочница (цифровая платформа)
Песочница в Digital значении является специальной виртуализированной средой, в которой разрабатываются и тестируются различные приложения, которые, как правило, могут легко содержать еще не отлаженный код. Делается это чтобы протестировать и отработать запуск приложения на реальной IT-инфраструктуре.
Релойкейт
Это трудовая эмиграция (обычно в США). Релокейт в IT — довольно частая практика. Многие профессионалы устраиваются только в компании, которые предоставляют возможность релокейта в штаты или в Европу.
Рефербишмент
Восстановление, мелкий ремонт неисправного бывшего в употребление сетевого оборудования, которое стояло у клиента. После ремонта (удачного) оборудование отдается снова на эксплуатацию
Рефакторинг
Это изменение кода приложения (программы) в сторону его улучшения, очищения и перепроектирования для более понятной структуры. При этом рефакторинг не подразумевает добавление новых процессов, функций и т.д. — «перетряхивание» затрагивает только существующий код.
Ресёрчер (Researcher)
В вакансиях по IT часто можно встретить позицию Researcher. По-простому это аналитик.
Рокет сайнс (Rocket Science)
Устойчивое выражение на английском языке, означающее трудную работу (умственную), которая требует специальных навыков. Часто употребляется в разговоре про программирование, т.к. разработка — процесс сложный и интеллектуально затратный
Ролл аут (Roll-Out)
Ролл аут — это представление продукта на рынке. Т.е. полноценный запуск, наладка, тестирование, пробная эксплуатация сайта/продукта/сети и прочего. Своеобразный «выход в свет».
Софт скиллз
Это набор непрофильных умений, которые не относятся к конкретной профессии, но помогают карьере в целом. Софт скиллзом обычно считается развитие тайм менеджмент, развитие коммуникативных способностей и других личностных качеств человека — инициативность, организованность, отзывчивость
Сущность (кодинг, данные)
Чаще всего под сущностью подразумевает какие-либо объекты или элементы, которыми можно управлять
Сэлф-драйвинг (Self-driving)
В широком смысле так называют беспилотные автомобили, которые сейчас проходят активное тестирование по всему миру. Иногда термин сэлф-драйвинг применяют, говоря про бизнес. Имеется в виду, что бизнес уже стабильно приносит прибыль и развивается без особого участия создателя/владельца.
Сеттинг (игры)
Так называют вселенную в игре, все её предметы, материальные вещи. Дизайн домов, одежда солдат, костюмы супергероев, горы, деревья — всё, что представляет собой окружение можно назвать словом «Сеттинг».
Схема as is
Существующая (действующая на данный момент) схема работы организации в целом или отдельного её процесса. Необходима для анализа бизнес-процессов, выявление недостатка в каком-либо из них. Это даёт возможность посмотреть на работу «со стороны», рассмотреть возможности оптимизации.
Тайм ту маркет (TTM, Time2market)
временной интервал от начала проекта по разработке нового изделия до поставки его первых экземпляров на рынок. Важнейший параметр при работе в высококонкурентной среде
Тонкий клиент
Компьютер, система, программа или приложение, которая не хранит пользовательских данных, «взваливая» обработку большей части (или даже всех) данных на серверную часть. Подобное приложение может не требовать установки на компьютер полноценного («толстого») клиента, не требует перезапуска при применении или изменении каких-либо настроек
Трекать
Следить, отслеживать что-то
Уберизация (услуг)
Уберизация — это один из главных процессов, который пришел с началом цифровых технологий. Уберизация услуг — это возможность получить услугу с помощью цифровой платформы, без посредников, напрямую с заказчиком (поставщиком) услуг. Одними из главных преимуществ уберизации стали скорость оказания услуг, которые до этого требовали больше времени и то, что отпала необходимость общаться с водителем/заказчиком по телефону или по другому стандартному способу связи.
Форсайт, форсайт-сессии (Foresight)
Это обширный экспертный прогноз по какой-либо направления инновационного характера, инфраструктуры и так далее. Цель форсайт-сессий предугадать и сформулировать вектор развития и будущую стратегию данного направления.
Фронт (фронт-энд)
Это «прокладка» между пользователем и программно-аппаратной частью приложения, сайта, CMS и так далее. Фронт-энд — это пользовательский интерфейс.
Фреймворк
Программная среда, которая позволяет начать разработку, имея некую платформу и инструменты, которые облегчают дальнейшую разработку. Самый частый пример — это фреймворк CMF — с его помощью создаются CMS (системы управления сайтом)
Фулл-стэк (разработчик, девелопер)
Full Stack Developer это веб разработчик имеющий знания и опыт в разработке как frontend, так и backend составляющих. Обычно требуется в компании, где нет деления на frontend/backend разработчиков, когда компания маленькая или фронтенд на проекте не требует большого количества разработчиков. Стеком технологий Full Stack разработчика обычно являются знания (JS, html/css, >=1 js framework, какой либо бекенд язык + фреймворки)
В более широком смысле, фулл стек разработчик — это специалист, который обладает знаниями для разработки веб проекта от А до Я, пусть и не очень глубокими. это квалифицированный специалист, который способен принимать активное участие во всех этапах разработки веб-приложений, начиная от серверной логики и ее реализации с помощью различных технологий и фреймворков, и заканчивая клиентским кодом, работающим непосредственно в браузере.
Хейтспич (hate speech)
Обычно таким называют пост в социальной сети, где ярко выраженная ненависть к определенной группе людей (или компании), открытые оскорбления
Шардинг
Это особая техника работы с данными. Суть шардинга в разделении БД на части таким образом, чтобы каждую из этих частей можно вынести на отдельный сервер. Бывает как вертикальный, так и горизонтальный. Вертикальный — помещение каждой таблицы на свой сервер. Горизонтальный — разделение одной большой таблицы на несколько серверов.
Шерить (документы, файлы)
Расшаривать или шерить файл — значить дать к нему общий доступ для всех пользователей. (От английского Sharing — Обмен, распределение).
Мой мир
Вконтакте
Одноклассники
Google+
mirdostupa.ru
блокчейн-маркетплейсы для машинного обучения / ВТБ corporate blog / Habr
Как создать мощнейший искусственный интеллект? Один из способов — использовать модели машинного обучения с данными, которые распространяются через маркетплейсы, основанные на блокчейне. Зачем здесь блокчейн? Именно с его помощью в будущем мы можем ожидать появления открытых электронных бирж, где каждый сможет продавать свои данные, не нарушая конфиденциальность. А разработчики — выбирать и приобретать наиболее полезную информацию для своих алгоритмов. В этом посте мы расскажем о развитии и перспективах таких площадок.
Сегодня основные элементы подобных систем только формируются. Простые начальные версии подобных решений внушают надежду на успех. Эти торговые площадки обеспечат переход от нынешней эпохи монопольного владения данными Web 2.0 к Web 3.0 — открытой конкуренции за данные и алгоритмы с возможностью непосредственной монетизации.
Возникновение идеи
Идея такой площадки возникла у меня в 2015 году после разговора с Ричардом из хедж-фонда Numerai. Они проводили конкурс на разработку модели фондового рынка и отправляли зашифрованные рыночные данные любому специалисту, желающему участвовать в нем. В итоге Numerai объединяет лучшие модели в «метамодель», продает ее и выплачивает вознаграждение тем специалистам, чьи модели работают эффективно.
Конкуренция между специалистами по обработке и анализу данных показалось перспективной идеей. Тогда я задумался: можно ли создать полностью децентрализованную версию такой системы, которая носила бы общий характер и могла быть использована для решения любых задач? Считаю, что на этот вопрос можно ответить утвердительно.
Проектирование
В качестве примера давайте попробуем создать полностью децентрализованную систему для торговли криптовалютами на децентрализованных биржах. Вот одна из возможных схем:
Поясним разные уровни ее работы:
Данные. Поставщики данных выставляют на биржу свои данные и делятся ими с разработчиками моделей.
Модели. Разработчики моделей выбирают, какие данные использовать, и создают модели. Обучение проводится с использованием безопасного метода вычислений, который позволяет обучать модели, не раскрывая используемые данные. Модели выставляются на биржу так же, как и данные.
Метамодели. Метамодель создается на основе алгоритма, который учитывает биржевую цену каждой модели. Создание метамодели необязательно — некоторые модели используются и без объединения в метамодель. Смарт-контракт использует метамодель в электронных торгах посредством децентрализованных биржевых механизмов (on-chain транзакции).
Распределение прибыли / убытков. По прошествии некоторого времени торги дают прибыль или убыток, которые делятся между разработчиками метамодели, в зависимости от их вклада в ее усовершенствование. Модели, которые оказали отрицательное влияние на метамодель, теряют привлеченные средства полностью либо частично. И поставщики данных для этой модели тоже терпят некоторые убытки.
Верификация вычислений. Вычисления на каждом этапе выполняются двумя способами. Либо централизованно, но с возможностью верификации и опротестования через механизмы типа Truebit. Либо децентрализовано, с использованием протокола конфиденциального вычисления.
Хостинг. Данные и модели размещаются либо на IPFS, либо на нодах в защищенной системе конфиденциального вычисления с большим количеством участников. On-chain хранилище в этом случае будет слишком дорогим.
Почему это будет эффективно и производительно?
Перечислим основные преимущества такой системы:
- Стимул для привлечения наиболее востребованных данных. Как правило, для большинства проектов машинного обучения основным ограничивающим фактором является отсутствие качественных данных. Правильно спроектированная структура вознаграждений позволит получить доступ ко всем наиболее ценным данным точно так же, как появление биткойна с системой вознаграждений участников привело к появлению мощнейшей в мире вычислительной сети. Кроме того, прекратить работу системы, в которой данные поступают из тысяч или миллионов источников, практически невозможно.
- Конкуренция между алгоритмами. Модели и алгоритмы напрямую конкурируют друг с другом в сферах, где раньше такого не было. Представьте себе децентрализованную сеть Facebook с тысячами конкурирующих между собой алгоритмов новостных лент.
- Прозрачность вознаграждений. Поставщики данных и моделей видят, что они получают справедливую цену за свои продукты, поскольку все вычисления можно проверить. Это будет привлекать еще больше поставщиков данных.
- Автоматизация. Транзакции проводятся в среде блокчейна и стоимость генерируется непосредственно в токенах. Таким образом все взаимодействие становится автоматизированным и замкнутым, не требующим установления доверительных отношений.
- Сетевой эффект. Участие пользователей, поставщиков данных и специалистов по обработке и анализу данных обеспечивает многосторонний сетевой эффект и делает систему саморазвивающейся. Чем лучше она работает, тем больше капитала привлекает. Больше капитала — больше потенциальных выплат. Это, в свою очередь, привлекает больше поставщиков данных и специалистов по их обработке, которые делают систему более совершенной и рациональной. В результате привлекается больше вложений, и далее по кругу.
Конфиденциальность системы
В дополнение к перечисленному, важнейшим свойством является конфиденциальность. Гарантия конфиденциальности позволяет рядовым пользователям спокойно предоставлять любые личные данные. А также препятствовать утрате экономической ценности как данных, так и моделей. Если оставить данные и модели незашифрованными в открытом доступе, они будут скопированы бесплатно и использованы другими лицами, которые не вносят какого-либо вклада в общее дело («эффект безбилетника»).
Частичным решением проблемы безбилетника является продажа данных в частном порядке. Даже если покупатели захотят перепродать или раскрыть данные, это не так страшно, потому что стоимость данных со временем все равно амортизируется. Однако при таком подходе данные используются исключительно в краткосрочной перспективе, а проблемы с обеспечением их конфиденциальности никак не решаются. Так что использование защищенных вычислений представляется хоть и более сложным, но и более действенным подходом.
Защищенные вычисления
Безопасные методы вычислений позволяют обучать модели без раскрытия самих данных. В настоящее время используются и исследуются три основных вида защищенных вычислений: гомоморфное шифрование (HE), протокол конфиденциального вычисления (MPC) и доказательство с нулевым разглашением (ZKP). Для машинного обучения с использованием личных данных сегодня чаще всего используется MPC, поскольку HE обычно работает слишком медленно, а как применять для машинного обучения ZKP — пока неясно. Методы безопасных вычислений — это актуальнейшая тема современных компьютерных исследований. Такие алгоритмы, как правило, требуют гораздо больше времени, чем обычные вычисления, и становятся бутылочным горлышком системы. Но в последние годы они были заметно усовершенствованы.
«Идеальная рекомендательная система»
Чтобы проиллюстрировать потенциал машинного обучения на частных данных, представьте себе приложение под названием «Идеальная рекомендательная система». Оно следит за всем, что вы делаете на своих устройствах: анализирует все посещаемые сайты, все действия в приложениях, просмотренные картинки на телефоне, данные о местоположении, историю расходов, информацию с носимых датчиков, текстовые сообщения, данные с камер в вашем доме и на ваших будущих очках дополненной реальности. Эта информация позволит приложению давать вам рекомендации: какой следующий веб-сайт посетить, какую статью прочитать, какую песню послушать или какой товар купить.
Эта рекомендательная система будет чрезвычайно мощной, мощнее любой из существующих «силосных башен» с данными Google, Facebook или кого-нибудь еще. Все благодаря максимально глубокому анализу и возможности обучаться с помощью самых чувствительных личных данных, которыми вы бы ни с кем больше не поделились. Как и в предыдущем примере с системой торговли криптовалютами, залогом функционирования рекомендательной системы является создание рынка моделей, ориентированных на разные области (например, рекомендации веб-сайтов или музыки). Эти модели конкурировали бы за доступ к вашим зашифрованным данным, возможность рекомендовать — и, вероятно, даже платили бы вам за использование ваших данных или за ваше внимание к рекомендациям.
Систему распределенного обучения Google и систему дифференциальной приватности компании Apple можно считать шагами в направлении машинного обучения с использованием личных данных. Но эти решения всё равно подразумевают установление доверительных отношений, не позволяют пользователям самостоятельно отслеживать свою безопасность и хранят данные обособленно.
Реализованные подходы
Говорить о полноценных системах такого рода еще рано. На данный момент мало у кого уже есть что-то работающее, и большинство идет к таким системам постепенно.
Компания Algorithmia Research разработала достаточно простое решение, которое премирует за модель с точностью выше определенного порога, определяемого ретроспективно:
Хедж-фонд Numerai ушел на три шага вперед. Его система:
- использует зашифрованные данных (хотя такой вид шифрования нельзя считать полностью гомоморфным),
- объединяет краудсорсинговых моделей в метамодель,
- премирует модели через собственный Ethereum-токен Numeraire на основании будущей эффективности (недели биржевой торговли), а не ретроспективного тестирования.
Специалисты по анализу данных должны использовать Numeraire в качестве оболочки, тем самым подтверждая собственный интерес и стимулируя будущую производительность. И всё же на текущий момент Numerai распространяет данные централизованно, так что самая важная характеристика системы все еще не реализована.
На данный момент успешный маркетплейс данных на основе блокчейна еще не создан. Первой попыткой разработать такую систему, хотя бы в общих чертах, стал The Ocean. Другие начинают с постройки безопасных вычислительных сетей. В рамках проекта Openmined ведется работа по созданию многопользовательской вычислительной сети для обучения моделей машинного обучения на базе Unity, которая может работать на любом устройстве, включая игровые консоли (аналогичные Folding at Home). Впоследствии планируется расширить эту систему до протокола конфиденциального вычисления. Аналогичного подхода придерживается компания Enigma.
В результате этих работ было бы здорово получить метамодели, которые предоставляли бы совладельцам — поставщикам данных и разработчикам моделей — права собственности в объеме, пропорциональном их вкладу в совершенствование метамодели. Модели были бы токенизированы и могли бы со временем приносить доход, а те, кто обучал их, могли бы даже управлять ими. Это был бы своего рода роевой интеллект, находящийся в совместной собственности. Из всего, что я пока видел, ближе всего к такой системе подошел проект Openmined, если верить видеоролику о нем.
Что может сработать быстрее?
Не буду утверждать, что знаю, какой проект лучше, но у меня есть некоторые мысли на этот счет.
Применительно к блокчейну я оцениваю систему следующим образом. Если разложить ее в непрерывном спектре «физическое-цифровое-блокчейн», то чем больше будет от блокчейна, тем лучше. Чем меньше в ней от блокчейна, тем больше приходится привлекать доверенных сторон. Так система становится сложнее, и ее все менее удобно использовать в качестве составной части других систем.
Это означает, что система заработает с большей вероятностью, если создаваемая ей стоимость будет поддаваться количественной оценке. В идеале — в денежном выражении, а еще лучше в виде токенов. Это позволит создать полностью замкнутую систему. Для оценки эффективности сравните систему выше, например, с системой распознавания опухолей на рентгене. В последнем случае вам нужно убедить страховую компанию в том, что рентгеновские снимки имеют какую-то ценность, договориться о том, насколько они ценны, а затем доверить небольшой группе людей подтверждение успеха или неудачи рентгена.
Такая система может использоваться и в массе других полезных сценариев. Их можно привязать к рынкам курирования (curation market) — они смогут работать в замкнутом цикле по блокчейн-модели, а токены этого рынка могут выступать в качестве премии. Сейчас картина еще не ясна, но я предполагаю, что со временем число областей, требующих применения блокчейна, будет только расти.
Последствия для рынка
Децентрализованные рынки данных и моделей для машинного обучения могут разрушить монополию на данные, которой обладают современные корпорации. На протяжении последних 20 лет они занимались стандартизацией и торговлей основным источником стоимости в интернете: проприетарными сетями передачи данных и тем влиянием, которое они оказывают. Но теперь создание стоимости связано уже не с данными, а с алгоритмами.
Циклы стандартизации и коммерциализации технологий. Мы приближаемся к концу эры сетей, монополизирующих данные.
Иными словами, они создают бизнес-модель искусственного интеллекта, основанную на прямом взаимодействии, обеспечивают и предоставление данных, и обучение моделей.
Появление децентрализованных рынков данных и моделей для машинного обучения может привести к созданию самых мощных ИИ в мире. За счет прямых экономических стимулов они смогли бы получать наиболее ценные данные и модели. Их сила увеличивается благодаря многосторонним сетевым эффектам. Монополии сетевых данных эпохи Web 2.0 превращаются в товары повседневного спроса и становятся хорошим материалом для новой конгломерации. Вероятно, нам к этому идти еще несколько лет, но мы идем в правильном направлении.
Как показывает пример рекомендательной системы, процесс поиска глобально инвертируется. Сейчас люди ищут товары — а в будущем товары будут искать людей и конкурировать за них. У каждого потребителя будут личные рынки курирования, на которых системы рекомендаций будут конкурировать за размещение наиболее релевантного контента на своих каналах. А релевантность будет определяться потребителем.
Новые модели позволят нам получать те же преимущества от мощных сервисов на основе машинного обучения, к которым мы привыкли на примере услуг Google и Facebook. Но без предоставления личных данных.
Наконец, машинное обучение будет развиваться быстрее, так как получить доступ к открытому маркетплейсу данных сможет любой инженер-разработчик, а не только небольшая группа инженеров в крупных Web 2.0 компаниях.
Проблемы
Прежде всего, безопасные методы вычислений в настоящее время работают медленно, а машинное обучение уже требует больших вычислительных мощностей. С другой стороны, начинает появляться интерес к методам безопасных вычислений, а их производительность растет. За последние полгода я видел несколько новых подходов, которые значительно улучшают производительность HE, MPC и ZKP.
Сложно определять ценность конкретного набора данных или модели для метамодели.
Вычищать и форматировать краудсорсинговые данные тоже непросто. Скорее всего, ряд инструментов будут использоваться в сочетании друг с другом, и в сегменте начнутся процессы стандартизации при активном участии небольших компаний.
Наконец, как это ни парадоксально, бизнес-модель для создания подобной обобщенной системы менее очевидна, чем в случае с системой частной. Та же ситуация со множеством новых криптопримитивов, в том числе с рынками курирования.
Заключение
Комбинация машинного обучения на основе частных данных с блокчейн-вознаграждениями может привести к созданию самых производительных систем искусственного интеллекта различного назначения. Сейчас существуют большие технические проблемы, которые со временем представляются вполне решаемыми. Этот сегмент обладает огромным потенциалом в долгосрочной перспективе, а его становление может ослабить доминирующее положение крупных интернет-компаний в области доступа к данным. Эти системы даже внушают некоторые опасения: они сами загружаются, самостоятельно развиваются, потребляют конфиденциальные данные и становятся почти неубиваемыми, заставляя меня задаться вопросом, а не приведет ли их создание к появлению самого мощного Молоха в истории. В любом случае, эти системы — еще один пример того, как криптовалюты могут сперва медленно, а затем стремительно ворваться во все сферы хозяйственной деятельности.
habr.com
Блокчейн + БигДата
Технология блокчейн в сочетании с возможностями Big Data — это мощная штука. Напомним, что Биг Дата — Большая Информация. Мы употребляем этот термин для обозначения океана информации, в котором мы купаемся. Все, что мы делаем, используя компьютеры, может быть записано, измерено, проанализировано. Все больше и больше вещей, которые мы привыкли считать всего лишь вещами, становятся компьютерами. Даже холодильники и наручные часы. Именно это мы называем IoT — Интернет Вещей. Объем информации нарастает.
Больше чем собственно информация, Биг Дэйта — это среда, позволяющая создавать умные вещи, используя сложные технологии записи, хранения и обработки данных.
Блокчейн
Главная мировая валюта, построенная на блокчейне — это Биткойн. Если не углубляться в технические детали, чтобы понять, насколько блокчейн шире, чем Биткойн, нужно оценить, что он создает. Блокчейн создает доверие. Задумайтесь о том доверии, которое необходимо для осуществления каждой электронной транзакции.
Доверие к банку, который вернет ваш вклад с процентами, доверие в правительству, которое мудро распорядится вашими налогами. Во всех этих случаях Блокчейн может быть использован и в перспективе способен заменить те промежуточные, посреднические звенья, которые сейчас используются для создания необходимого при заключении сделок доверия. Горе банкам.
Блокчейн — это публичная, прозрачная и распределенная база данных, в которой новые участники и новые сделки постоянно группируются в блоки. Эти блоки «подтверждаются» своеобразным голосованием сети, состоящей из множества пользовательских узлов, а затем соединяются друг с другом в постоянно удлиняющуюся цепь. Цепь из блоков — всё просто.
Длина цепочки и сложность её кодировки делают практически бессмысленной задачу по её дешифровке и фальсификации. В дополнение к этому Блокчейн постоянно укрепляет доверие, используя для общего блага тягловую лошадку личной корысти. Любые действия, укрепляющие целостность и безопасность системы Блокчейн, не остаются без вознаграждения.
Объединение технологий
Что же может произойти, если функционал Блокчейна и Биг Дата в какой-то момент объединится? Создают ли они вместе потенциал для социалистического преображения общества или напротив — укрепляют его фундамент?
Давайте для примера рассмотрим производство еды. Представьте себе будущее, в котором информация из каждого холодильника незримо сливается в блокчейн, чтобы впоследствии точно и прозрачно предсказывать продовольственные потребности целого государства.
Параметры вашего потребления молока в сочетании с информацией о складских запасах магазинов заранее сообщат сельхозпроизводителям, каковы потребности рынка. Предприятия будут точно знать, сколько молока, сыра, йогурта и сметаны необходимо произвести.
Такая осведомленность на государственном уровне расчищает площадку, создает условия для наступления социализма. Появляется возможность точнейшего распределения ресурсов и одномоментного производства, которые сделают весь процесс намного более эффективным, чем если бы он основывался на годовых статистических прогнозах.
Больше того, такое планирование будет эффективнее, чем рыночное. Вдумайтесь — сегодня по дороге от фермы до холодильника мы теряем около трети производимого продовольствия. В масштабах планеты это около триллиона долларов ежегодно.
Впрочем, та же самая осведомленность, если обладать ей будет не государство, а рыночные агенты, может сделать капитализм в равной степени эффективным.
Если улучшается центральное планирование, нет необходимости уничтожать рыночную среду и обобществлять ферму или завод. Все зависит от того, как эти технологии будут использоваться.
Точно так же, как ОПЕК поступает с нефтью; Facebook, Google, Microsoft, Apple, Amazon и другие, скорее всего, постараются защитить свои конкурентные преимущества, создавая барьеры для распространения информации и доступа к ней.
Именно здесь и вступает в игру Блокчейн. С его помощью можно создать публичные, прозрачные и распределенные базы данных, где БигДэйта будет по факту анонимна — то есть обобществлена. В Блокчейне наши личные данные становятся достоянием всех и вся, а не собственностью элитарной группы избранных, стремящихся извлекать свою выгоду.
Конечно, большие компании не расстанутся добровольно со своими базами данных. Поэтому государство должно будет снижать барьеры для доступа к информации, быть может, законодательно закрепив право пользователей скачивать свою личную информацию в легко читаемом формате. Но едва ли государства пойдут на это без общественной поддержки или давление.
Все это, конечно, нельзя назвать рецептом для революции, но есть все основания считать Блокчейн и БигДэйта важными инструментами для обеспечения доступа к информации и перераспределения богатства.
Одновременно — независимо от крупных компьютерных корпораций — капиталисты всего мира тоже наверняка оценят мощный потенциал этих технологий в ускорении процесса творческого разрушения, столь важного для любой рыночной экономики.
Подведем итог
Сами по себе Блокчейн и БигДата представляют идеологически нейтральные явления — не положительные и не отрицательные. Как и всегда, способ применения этих технологий зависит в первую очередь от устремлений и убеждений тех людей, в чьих руках они оказались. То есть каждый вариант возможен. Но в любом случае будущее, в котором информация приносит пользу, требует нашего коллективного действия и надзора.
Из зарубежных источников
1ethereum.ru
ICO проекта BurstIQ, блокчейн на Big Data и машинном обучении
Блокчейн BurstIQ представляет собой децентрализованную систему на основе Big Data и машинного обучения. В силу того, что данные становятся все более важными в сфере здравоохранения и экосистеме компаний, поддерживающих ее компания BurstIQ была создана в 2015 году с целью решения трех важнейших проблем. выделяемых при операциях с информацией в сфере здравоохранения:
- Медицинские данные разрознены и изолированы слабо или совсем не интегрированы с другими источниками данных
- Регулирование согласно законодательным актам, подобным HIPAA (Health Insurance Portability and Accountability Act) в CLUA, хотя и являющихся безусловно полезными и необходимыми, создает чрезвычайные сложности для эффективного объединения и обмена данными между людьми и организациями, которые нуждаются в этом или получат пользу при этом
- Люди чаще всего имеют ограниченный доступ к собственным медицинским данным. а также испытывают трудности с их пониманием и интерпретацией, даже если эта информация доступна для них.
Вследствие необходимости преодоления перечисленных вопросов была разработана платформа BurstIO, использующая технологию блокчейн и машинный интеллект для обеспечения возможности объединения данных из разрозненных источников с целью создания единого и унифицированного информационного репозитория, а также для обеспечения быстрого и легко осуществимого обмена, при этом по-прежнему строго сохраняющая соблюдение стандартов безопасности и подобных HIPAA законодательных постановлений.
С момента создания платформа BurstlQ развилась до полнофункциональной платформы с устойчивыми источниками получения прибыли, многочисленными крупными компаниями в качестве клиентов и сотнями тысяч паттернов жизнедеятельности из LifeGraphs.
B первые 12 месяцев функционирования c помощью платформы BurstlQ было обработано 25 миллиардов единиц данных.
Токены платформы BurstlQ (BiO) обеспечивают полноценный доступ к системе Health Singularity, Токены Bio будут использоваться B качестве кредитов для осуществления операций на уровнях визуализации машинного интеллекта и торговой площадки, включающих широкий диапазон связанных со здравоохранением сервисов. С течением того, как экосистема будет расширяться и развиваться, такие сервисы будут включать в себя обследования точной медицины (профилактика и лечение заболеваний подбирается главным образом по генетической информации). Услуги лечения и оздоровления сервисы доступа к обособленным сегментам клиентов, сервисы сбора и аналитики клинической и операционной информации, а также многие другие сервисы. С ускорением темпов внедрения инновационных решений, новые и ранее невообразимые процедуры, профилактические медицинские решения и ВгВ продукты и услуги будут появляться в качестве онпайн сервисов.
BurstlQ предлагает токены BiQ для создания сообщества людей и организаций, заинтересованных в создании действительно универсального механизма обмена медицинскими данными и торговой площадки, где Bio являются основной валютой экономической системы.
Характеристики токенов
Название токена: BurstIQ Token (BiQ)
Тикер (символ токена): BIQ
Используемый блокчейн: Elhereum
Формат предложения токенов: едино разовое в полном объеме
Общее количество токенов: 1 000 000 000
Принимаемые криптовалюты: ЕТН (пожалуйста ознакомьтесь с правовой документацией и условиями продажи токенов в меморандуме, которые будут опубликованы компанией BiQ Health для получения подробной информации)
Условия проведения: Дата начала распределения токенов: Дата завершения продажи токенов: Стоимость токенов: 0.12 USD B ETH эквиваленте за 1 токен BiO на момент проведения краудсейла.
Ссылка на официальный сайт проекта BurstIQ http://www.burstiq.com/
Ссылка на ICO BurstIQ — http://www.burstiq.com/biq-token-crowdsale/
Распределение токенов BurstIQ
Не установлено ограничений на количество доступного для каждого временного периода количества токенов BiO. Такой порядок установлен для обеспечения всем желающим равных возможностей участия с получением соответствующего бонуса в обозначенные периоды. Однако, количество продаваемых токенов
будет ограничено 70% OT общего количества токенов.
Бонусная система применяется для побуждения участников не откладывать решение об участии. K примеру, если инвестор принимает участие в первой
неделе и приобретает 100 BiQ, то в общем для него будет выделены эти 100 BiQ + 20% бонусных токенов, что в сумме составит 120 BiQ.
Для получения более подробной информации относительно графика продажи токенов и распределения средств и другой пожалуйста, ознакомьтесь
с меморандумом продажи токенов и дорожной картой проекта.
Скачать WHITEPAPER проекта.
Самые последние новости криптовалютного рынка и майнинга:mining-cryptocurrency.ru