ваш коллега объясняет ребенку что такое большие данные

Урок в рамках проекта «урок цифры» на тему «Big Data»

Ищем педагогов в команду «Инфоурок»

Выбранный для просмотра документ Big-data_no-internet.pptx

ваш коллега объясняет ребенку что такое большие данные. Смотреть фото ваш коллега объясняет ребенку что такое большие данные. Смотреть картинку ваш коллега объясняет ребенку что такое большие данные. Картинка про ваш коллега объясняет ребенку что такое большие данные. Фото ваш коллега объясняет ребенку что такое большие данные

Описание презентации по отдельным слайдам:

Всероссийская образовательная акция «Урок цифры» 2019 Большие данные «Сегодня у нас пройдет нестандартное занятие в рамках акции «Урок Цифры», которая проводится по всей России. В ее рамках будет проведен цикл необычных уроков информатики, которые пройдут в большинстве школ страны и охватят миллионы учеников с 1-го по 11-й классы. Каждый из них будет посвящен определенной теме: большие данные, сети и облачные технологии, безопасность будущего, персональные помощники, искусственный интеллект. Акция направлена на развитие цифровых компетенций, знаний и навыков, востребованных в современном мире/. Мы живем в цифровом мире и каждый день сталкиваемся с большими данными, даже если не подозреваем об этом. Например, пользуясь смартфоном, вы приобщаетесь к теме больших данных. Как вы думаете, каким образом это происходит?» (Выслушайте ответы детей). (переход к следующему слайду)

Что такое большие данные и кем я стану, если буду работать с большими данными? Мы с вами сегодня вместе постараемся ответить на несколько вопросов. Постараемся понять, что же такое большие данные, а еще узнаем, кем вы можете стать в будущем если захотите работать с данными. (переход к следующему слайду)

Характеристики больших данных: Скорость (velocity) Разнообразие (variety) Объём (volume) Достоверность (veracity) Ценность (value) На самом деле, нет четкого и всеми принятого определения, что же есть большие данные. Среди многих специалистов в качестве определяющих характеристик для больших данных традиционно выделяют «три V»: 1) объём (volume, в смысле величины физического объёма, то их точно должно быть «много»: десятки террабайт, а может, и петабайты), 2) скорость (velocity, в смыслах как скорости их постоянного прироста, так и необходимости высокоскоростной обработки и получения результатов на основе этих данных), 3) многообразие (variety, в смысле возможности одновременной обработки различных типов структурированных и полуструктурированных данных). Также некоторые добавляют к ним еще 4) veracity — достоверность (то, что эти данные репрезентативны и непротиворечивы) и value — ценность (у больших данных обязательно есть понимание, что в них лежит что-то полезное, хотя многие данные сегодня собираются и далеко не все из них подлежат обработке, большинство просто хранится до нужного времени). (переход к следующему слайду)

Большие данные вокруг Рекомендация контента в соцсетях Фильтрация спама, группировка писем по темам Создание музыки, текстов, картин Тренировочные игры с ботами Диагностика заболеваний Мы тоже для вас подготовили несколько примеров (если их уже называли дети – стоит отметить, что они молодцы и почти все называли из наших примеров, и рассмотрите только те, которые остались неохваченными). (переход к следующему слайду)

Количество жителей Избербаша Годы 41 200 человек 2006 год 41 800 человек 2007 год 50 800 человек 2008 год 51 246 человек 2009 год 55 646 человек 2010 год 55 600 человек 2011 год 55 919 человек 2012 год 55 988 человек 2013 год 56 322 человек 2014 год 56 914 человек 2015 год 57 511 человек 2016 год 58 170 человек 2017 год 58 690 человек 2018 год 59 494 человек 2019 год

Соединение блоков данных, валидация, очистка Структурирование данных Построение прогнозных моделей Проверка гипотез Поиск инсайтов Сбор данных с датчиков Сохранение действий пользователей Получение внешних данных Генерация Предобработка Анализ Создание и наполнение баз данных Создание и поддержание инфраструктуры для хранения данных Процесс работы с данными

Профессии, связанные с большими данными Дата-инженер ИТ-проповедник Дата-маркетолог Специалист по машинному обучению Утилизатор больших данных Архитектор информационных систем «Кто же создает все эти алгоритмы, нейросети, кто с ними работает? На самом деле — очень много разных специалистов. На слайде – лишь представлены лишь некоторые из них. Давайте попробуем разобраться, кто есть кто и чем занимается. Как вы думаете, какие из них существуют уже сейчас, а какие появятся в ближайшем будущем? А как вы думаете, чем занимаются остальные люди на картинках?» Примерный текст для рассказа про некоторые новые профессии: «ИТ-медик Врач с хорошим знанием информационных технологий, который создает, обрабатывает и анализирует физиологические данные и индивидуальные показатели состояния здоровья пациентов и применяет к ним методики работы с большими данными. На основании проведенного анализа он предлагает индивидуальные рекомендации для выздоровления пациентов. Архитектор информационных систем Мало собрать данные. Их нужно упаковать и разместить в некотором месте. Для того, чтобы с данными было удобно работать, крайне важно правильно организовать их хранение и администрирование так, чтобы в любой момент любой пользователь мог получить доступ именно к тем данным и в том виде, в котором они ему необходимы. Этим занимается архитектор информационных систем. Клинический биоинформатик Биоинформатика – это изучение процессов, связанных с организмом человека, но с помощью компьютерного моделирования. В случае нестандартного течения болезни клинический биоинформатик строит компьютерную модель биохимических процессов болезни, чтобы понять первопричины заболевания, выявляет нарушения на клеточном и субклеточном уровнях. ИТ-проповедник Обучение людей новым технологиям, убеждение их, что цифровой мир несёт им благо, а не зло, привлечение их на свою сторону – это задача, которая будет становиться все важнее по мере того, как диджитализация будет проникать в привычный нам мир вещей. Задачи для такого специалиста две: обучение людей новым технологиям, помощь им в приобретении новых навыков, а также снятие зачастую иррациональных страхов перед цифровым миром. Системный инженер интеллектуальных энергосистем Умные сети постоянно генерируют огромное количество данных на всех своих участках. Использование технологий больших данных в электроэнергетике позволяет не только сократить расходы производителей, транспортеров и конечных потребителей энергии, но и сделать электроэнергию более «зеленой», а планету — более чистой. Поэтому специалисты в этой сфере так необходимы. BIM (Building Information Model) — проектировщик Сейчас никто не строит здания по чертежам на бумаге. На всех этапах строительства используется компьютерное моделирование. Но это не просто чертежи, перенесенные в 3D-формат. Это целая система данных о каждом этапе строительства, то есть весь жизненный цикл здания – в одной системе. Конечно, это огромные объемы данных, в которых должен разбираться BIM-инженер. Дата-инженер Суть работы дата-инженера заключается в построении стабильных систем добычи и очистки данных, чтобы процесс последующего анализа полученных больших массивов данных был максимально удобным и доступным для аналитиков компании. Именно от написанных им программ зависит качество «сырых» данных на входе в модели, которые используются для создания новых алгоритмов. Антифейковый менеджер Этот специалист создает уникальный информационный стиль компании или конкретного человека, чтобы его было сложно скопировать при помощи алгоритмов. Он хорошо понимает, как создаются фейки, умеет отличать созданные нейросетью голос, текст и видео от оригинальных и умеет очищать факты в новостях.

Выбранный для просмотра документ план урока.docx

Источник

Посади дерево, сохрани свой поп-ит: объясняем ребенку, что такое углеродный след

Как долго живет одноразовая бутылка и почему стоит обходить стороной пластиковые игрушки без маркировки? Анна Нафиева рассказала «Афише Daily», как доступно объяснить ребенку про углеродный след и жизненный цикл товара, не вызывая неврозы.

Магистр программы «Экологическое просвещение» МГПУ, сооснователь экоцентра «Сборка», координатор проекта «#МосЭко»

Как связаны углеродный след, парниковый эффект и глобальное потепление

Эти термины используются в СМИ и общении все чаще не только из‑за изменений климата, но и в связи с развитием одноразовой культуры, быстрой моды (когда фешен-коллекции сменяют друг друга не четыре раза в год, а до сорока раз в год внутри одного бренда). Для производства вещи требуется много ресурсов, а вот жить она будет недолго: футболку носят три раза, а пластиковая бутылка для воды используется считаные минуты. Потом выброшенные товары исчезают из нашей жизни: они либо гниют на мусорных полигонах десятки и сотни лет, либо сжигаются в специальных печах. Оба варианта вредят окружающей среде.

Из чего образуется углеродный след смартфона

Скорее всего, если родитель объясняет, что такое углеродный след, он хочет сказать, что за каждой вещью стоит некая история.

В любом случае разговор с ребенком не будет коротким. Конечно, можно ограничиться фразой «Бездумное потребление приводит к затратам ресурсов и утрате территорий». Но можно углубиться в тему. Попробуйте спросить ребенка: из чего состоит телефон? Дети, как правило, не знают о том, что в их устройстве есть ценные металлы. Потом можно рассказах о путешествии, которое совершает содержимое телефона. Так мы подойдем к теме транспортного следа — то есть углеродного следа всех перевозок. Чем длиннее путь перевозки для товара, чем больше посредников между производителем товара и ее покупателем, тем больше транспортный след вещи. Транспортный след занимает второе место после добычи ценных ресурсов по вкладу в углеродный след.

Как избавиться от вещи, чтобы минимизировать вред природе

Товар доставляют в наш город, и мы покупаем его в магазине. Прежде всего надо максимально продлить вещам жизнь: вовремя чинить, не бросать, если речь идет о гаджетах. Многие дети этого не осознают и к вещам относятся довольно халатно. Форма использования вещей тоже очень важна: чем дольше живет ваш конструктор LEGO, тем лучше.

Появляются движения в поддержку шеринга, когда люди не покупают вещи, а берут их во временное пользование и передают незнакомым людям. Делиться можно не только одеждой, но и игрушками: в России есть «Неваляшка-шеринг», «Дару-дар» и другие организации, занимающиеся шерингом.

Когда же вещь выходит из строя, ее лучше всего направить на переработку. Сейчас появляется все больше возможностей для этого. Есть московская карта пунктов приема Recyclemap. Мы в своем центре стараемся максимально расширить спектр того, что люди могут принести на переработку.

Как развить экограмотность

Для родителей и педагогов, которых интересуют вопросы экологического просвещения, рекомендую отличный портал «Экокласс». Этот ресурс сделали профессиональные педагоги. Там собраны интерактивные уроки по экологии для детей, которые можно пройти в классе или дома с родителями.

Есть просветительские фильмы. Например, «Дом», который доступно рассказывает про влияние человека на нашу планету. Не всем детям, конечно, интересно смотреть кино по полтора часа, но попробовать стоит. Есть и более короткие фильмы, например серия «История вещей».

Как выбирать игрушки

Каждый случай индивидуален. Если мы приобретаем матерчатую куклу, сшитую в России, а синтетическая ткань для нее куплена в Китае, то разница между отечественной и заграничной игрушкой в вопросе ее углеродного следа стирается. Но если игрушка сделана из местных материалов, например дерева, то разница будет ощутимой.

К сожалению, мы не всегда можем определить, что и откуда приехало. Пример из жизни: недавно покупала в интернет-магазине кошачий наполнитель. Продавец написал, что товар произведен в Санкт-Петербурге. А когда посылка приехала, выяснилось, что это китайский наполнитель, а в Питере находится импортер компании.

Не многие продавцы готовы открыто и подробно рассказывать о своем товаре. Особенно это касается сферы игрушек. Нам очень часто привозят на переработку целые коробки пластиковых кукол и зверюшек, произведенных в Китае. Проблема с этими товарами в том, что пластик в китайском производстве не маркируют. И он зачастую может быть небезопасен для детей: производитель не сообщает, какие он использует красители, какой именно пластик. Довольно часто в состав игрушек входит ПВХ (бесцветная пластмасса), который при обработке токсичен. И получается, что нам и сдать такие товары некуда — мы просто не знаем, из какого материала сделаны эти изделия.

Насколько эффективна компенсация углеродного следа

Ваш углеродный след можно высчитать на специальном калькуляторе, ответив на ряд вопросов вроде «Какова площадь вашей квартиры?» или «Как часто вы ездите на автомобиле?». Таких калькуляторов в интернете несколько.

Например, такой. Мне он нравится больше всех, потому что он подробный, задает реальные вопросы по образу жизни человека и его семьи. Калькулятор от WWF, например, скорее более развлекательный.

Это условные данные — все просчитать невозможно. Но все-таки благодаря таким калькуляторам семья может понять, сколько она потребляет. Можно поиграть с этими данными и посмотреть, что будет, если заменить поездки в торговые центры на выходные пешей прогулкой до парка.

Но для ребенка, я думаю, очень важно хотя бы один раз приехать на высадку дерева. Во-первых, это само по себе очень интересное занятие, во-вторых, это настоящий труд, который существенно расширяет картину мира городского ребенка. Посадить дерево непросто. Мы не можем взять саженец, воткнуть его в землю и пойти дальше. На самом деле есть довольно строгая технология высадки деревьев. Это дает понимание, что мы не сможем целый год покупать гаджеты, меняя их на новые модели, а потом задонатить, чтобы кто‑то потыкал несколько деревьев, и на этом все, мы молодцы. Этот опыт учит нас ответственности за то, что мы потребляем.

Что такое углеродная нейтральность товара

Насколько я знаю, единой сертификации углеродной нейтральности пока нет. Это скорее про самоидентификацию для производителей товаров и услуг. Если на товаре появилась наклейка с информацией про углеродную нейтральность, это значит, что производитель посчитал свой углеродный след. Но не на тех калькуляторах, которые я перечислила выше, — есть высокоточные технологии для подсчета. И узнав эти данные, компания либо старается минимизировать свой след, либо компенсировать с помощью посадки деревьев. Но здесь появляется еще одна проблема — гринвошинг.

Есть международные экомаркировки, которые тоже измеряют углеродный след, но они больше оценивают жизненный цикл вещи или услуги от состояния добычи сырья до этапа утилизации. Сюда входит и состав, и методы производства. Это дорогие процедуры сертификации, которые могут отнять несколько лет у производителя. Малый и средний бизнес с трудом может себе это позволить, а крупный не всегда хочет. В России уже есть такая маркировка — «Листок жизни». Пока это единственный сертификат в нашей стране, которому можно доверять. Если производитель приклеил эту наклейку на товар легально, то на сайте «Листка жизни» будет вся информация про жизненный цикл вещи.

Как снизить углеродный след человека

По нашим подсчетам, из среднестатистического мусорного ведра уже сейчас можно сдать около 70% вещей на переработку. Но необходимо изначально стремиться не покупать лишнего. При этом и давить на ребенка, призывая отказаться от игрушек и прикольных штук, не стоит. Если очень хочется купить поп-ит — не надо страдать: можно иметь один поп-ит, а не десять. Рационализировать потребление не так сложно: достаточно честно спросить себя перед покупкой: «А нужна ли мне эта вещь?»

Источник

Что такое big data: зачем нужны большие данные, как их собирают и обрабатывают

Все вокруг говорят о больших данных: что с их помощью можно анализировать бизнес-процессы, предсказывать поведение клиентов, управлять производством и даже разрабатывать искусственный интеллект. Разберемся, что это, для чего они нужны и как работают.

Что такое большие данные

Если обобщить, то биг дата — это большой объем информации, который компания собирает и хранит для последующего использования. Еще когда говорят, что компания использует большие данные, часто имеют в виду не сами данные, а технологии для их обработки.

Какие данные можно считать большими

Чтобы отделить большие данные от обычных, нужно ответить на вопрос: «big data — это сколько?». Таблица в Экселе на 500 000 строк — это большие данные? А если строк миллиард? Текстовый файл на тысячи слов, который весит 2 мегабайта, — это много? А распечатки графиков температуры всех метеостанций Архангельской области — много или еще недостаточно?

Тут многие скажут, что эти примеры представляют собой довольно внушительное количество информации. Действительно, с такой точки зрения, все перечисленное — большие данные. Но что вы скажете про таблицу в Экселе на миллиард строк? Это тоже большие данные — и куда побольше тех!

На интуитивном уровне специалисты, далекие от big data, привыкли называть большими данными любой объем информации, который сложно удержать в голове и/или который занимает много места. И такое интуитивное определение, конечно же, неправильно.

Однозначно отделить формат больших данных от обычных помогут три критерия.

Данные должны быть цифровыми. Книги в национальной библиотеке или стопки документов в архиве компании — это данные, и часто их много. Но термин big data означает только цифровые данные, которые хранятся на серверах.

Данные должны поступать в объективно больших объемах и быстро накапливаться. Например, база заказов интернет-магазина по продаже колясок может быть большой: 10 миллионов заказов за 20 лет, но пополняется она со скоростью 100 заказов в сутки — это не большие данные. Фильм в высоком качестве может занимать десятки гигов, но со временем его размер не растет — это тоже не big data.

А вот записи показателей пары сенсоров в двигателе Боинга, поступающие в количестве несколько гигабайт в час и загружаемые на диагностический сервер производителя авиатехники — это уже big data.

Данные должны быть разнородными и слабо структурированными. Заказы в онлайн-магазине упорядочены, из них легко извлечь дополнительные статистические параметры, например, средний чек или самые популярные товары. Поэтому эти данные не относят к big data.

Показания датчиков температуры с корпуса самолета, записанные за последние 6 месяцев, — информация, в которой есть польза, но не очень понятно, как ее извлечь. Можно, конечно, рассчитать средние значения температуры за бортом самолета за полгода, но какой в этом смысл? А если погрузиться в анализ этих данных глубоко — можно вытащить много неочевидной информации. Например, о длительности перелетов, скорости набора высоты, климатических условиях за бортом и так далее. Информация интересная и полезная, но трудноизвлекаемая, значит, это большие данные.

Этот критерий не всегда обязательный. Иногда большие объемы структурированных данных, которые постоянно пополняются, относят к формату big data, особенно если их используют для машинного обучения или выявления неочевидных закономерностей. То есть если к структурированным данным применяют методы анализа big data, можно сказать, что это они и есть.

Итак, большие данные — это трудноанализируемая цифровая информация, накапливаемая со временем и поступающая к вам солидными порциями

Зачем нужна big data

Когда в любом IT-проекте начинают работать с данными, в первую очередь анализируют наиболее очевидные, значимые и понятные показатели. Так, если речь идет об онлайн-торговле, сначала смотрят на средние чеки заказов, топ продаж и объемы складских запасов. Когда речь идет о самолетах — смотрят скорость, высоту, расход топлива.

Сбор и анализ очевидных метрик позволяет вносить в систему простые и понятные корректировки. Такие улучшения практически сразу дают ощутимый результат. Это называется «сбор фруктов с нижних веток дерева».

По мере эволюции системы инженеры прорабатывают все видимые узкие места в проекте. После этого начинается стагнация продукта: для поиска новых путей развития нужно лезть выше, чтобы собрать плоды с более высоких веток. Инженеры и аналитики начинают собирать и анализировать косвенные данные, напрямую не связанные с основными метриками проектов.

Например, в онлайн-торговле можно собирать со страниц магазина данные о перемещении курсора (или пальца) по экрану. Или собирать данные с большого числа сенсоров самолета, например: число оборотов двигателя, состав топливно-воздушной смеси, забортную температуру и температуру выхлопа. Или анализировать слова в комментариях клиентов в соцсетях для оценки их лояльности.

Такие данные напрямую не связаны с основными метриками IT-системы и бизнеса, но при правильном анализе могут рассказать много интересного о возможных точках оптимизации в проекте. Работа с такими данными — как поиск нефти. Нужно пробовать разные места, применять различные стратегии поиска и извлечения скрытых ресурсов, спрятанных в данных. Далеко не все попытки будут успешны, но в итоге находки могут принести массу выгоды.

Большие данные в основном помогают решать четыре задачи:

Анализировать текущее положение дел и оптимизировать бизнес-процессы. С помощью больших данных можно понять, какие товары предпочитают покупатели, оптимально ли работают станки на производстве, нет ли проблем с поставками товаров. Обычно для этого ищут закономерности в данных, строят графики и диаграммы, формируют отчеты.

Делать прогнозы. Данные о прошлом помогают сделать выводы о будущем. Например, примерно прикинуть продажи в новом году или предсказать поломку оборудования до того, как оно действительно сломается. Чем больше данных, тем точнее предсказания.

Строить модели. На основе больших данных можно собрать компьютерную модель магазина, оборудования или нефтяной скважины. Потом с этой моделью можно экспериментировать: что-то в ней изменять, отслеживать разные показатели, ускорять или замедлять разные процессы для их анализа.

Автоматизировать рутину. На больших данных учатся автоматические программы, которые умеют выполнять определенные задачи, например, сортировать документы или общаться в чатах. Это могут быть как примитивные алгоритмы, так и искусственный интеллект: голосовые помощники или нейросети.

Больше интересных кейсов использования big data читайте в статье «Зачем вам большие данные: примеры использования big data в 8 отраслях».

Технологии работы с большими данными

Мы разобрались, что такое большие данные и какую пользу они могут принести. Теперь посмотрим, как в общих чертах работают системы анализа больших данных и какие инструменты нужны для их работы.

Упрощенно работа с big data происходит по следующей схеме: информацию собирают из разных источников → данные помещают на хранение в базы и хранилища → данные обрабатывают и анализируют → обработанные данные выводят с помощью средств визуализации или используют для машинного обучения.

Для технологий, которые работают с большими данными, базовым принципом считают горизонтальную масштабируемость, то есть возможность обрабатывать данные сразу на множестве узлов (серверов, компьютеров). Если обрабатывать такой массив информации на одном узле, это займет слишком много времени.

Итак, к основным технологиям для работы с большими данными относят:

McKinsey также включает в этот список технологии Business Intelligence и реляционные системы управления базами данных с поддержкой языка SQL

Рынок big data в мире и в России

По данным отчетов, в 2020 году мировой рынок big data составляет 138,9 млрд долларов, к 2025 году он вырастет до 229,4 млрд долларов — будет расти по 10,6% в год. Вплоть до 2025 года лидерство на рынке будет удерживать Северная Америка, в частности США.

В основном такой рост вызван повышением интереса к IoT — сейчас к интернету вещей подключено 30,73 млрд устройств, а к 2025 году их будет 75,44 млрд. Кроме того, уже сейчас без больших данных компании не выдерживают конкуренцию с теми, кто использует big data, так как не могут обеспечивать достаточный уровень клиентского сервиса.

По российскому рынку данных за 2020 год пока нет. В 2018 году отечественному рынку прогнозировали рост до 1,4 млрд долларов. По оценкам 2019 года, за счет больших данных ВВП России вырастет на 1,94 трлн рублей, а к 2024 эта сумма увеличится до 4,2 трлн. Особенно большой выигрыш от больших данных в России получат отрасли добычи полезных ископаемых, торговли, ремонта и строительства.

Источник

ВВЕДЕНИЕ В БОЛЬШИЕ ДАННЫЕ ДЛЯ ШКОЛЬНИКОВ

ВВЕДЕНИЕ В БОЛЬШИЕ ДАННЫЕ ДЛЯ ШКОЛЬНИКОВ

Лапшева Елена Евгеньевна
кандидат педагогических наук, доцент

ФГБОУ ВО «Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского »
Россия, г.Саратов
e-mail: lapsheva@yandex.ru

Огнева Марина Валентиновна
кандидат физико-математических наук

ФГБОУ ВО «Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского »
Россия, г.Саратов
e-mail: ognevamv@gmail.com

В современном информационном обществе основной ценностью и предметом потребления становится информация. С появлением и развитием цифровых технологий, компьютерных сетей, онлайн-сервисов и социальных сетей объем данных стал возрастать экспоненциально. Ежедневно происходит обмен электронными письмами, фотографиями, видео, сообщениями и обсуждениями, публикация различных данных, совершаются онлайн-покупки. Естественно возникает потребность извлекать из этих данных полезную информацию, обрабатывать и анализировать ее.

Наука о данных (data science) – это совокупность методов и технологий, которые позволяют извлекать знания из данных, для работы в этой области необходим междисциплинарный набор знаний и навыков, необходимых для извлечения знаний (data mining) [1, 5].

Порог входа в data science высокий и различных методов для обработки данных, основанных в том числе, на знаниях высшей математики, много, поэтому чем раньше начнется формирование базовых навыков, необходимых для работы в этой области, тем более успешным будет дальнейшее обучение и профессиональная карьера.

Основы программирования на языке, который наиболее приспособлен для анализа данных, например, Python можно изучать уже в 8 – 9 классах (в рамках элективного курса или кружка), а в 10 и 11 классах делать упор на прикладное применение полученных знаний, а именно – на анализ данных с его помощью. Стоит отметить, что сейчас инициатива по преподаванию основ языка Python уже реализуется, например, компанией «Яндекс», которая в 2016 году открыла «Яндекс.Лицей» в четырех городах России [6]. В 2017 году это проект охватил 19 городов России и два города Казахстана. Саратов стал одной из стартовых площадок этого проекта. И ребята, заканчивающие в этом году программу Яндекс.Лицея, своими работами показывают, что освоение языка программирования Python на достаточно высоком уровне под силу школьникам 8-10 классов.

Лучшим инструментом для охвата большой аудитории школьников и ознакомления их с новыми тенденциями в сфере информационных технологий являются научно-популярные лекции. Преподаватели факультета компьютерных наук и информационных технологий Саратовского национального исследовательского государственного университета имени Н.Г. Чернышевского (КНиИТ СГУ) регулярно рассказывают о новшествах в сфере IT школьникам Саратова. Эти лекции проходят в рамках проектов «Школьная академия» (Физико-технический лицей №1) или «Просто о сложном» (Лицей математики и информатики).

Приведем небольшой пример содержания одной такой лекции о больших данных. При работе над ней встал вопрос о том, как показать школьникам: что такое Big Data? Почему они «большие»? Этот термин был введен редактором журнала Nature Клиффордом Линчем в 2008 году. Хорошим наглядным примером демонстрации и визуализации этого термина может явиться сравнение одного байта данных с рисовым зерном (0,03 г). Тогда один килобайт – это чашка риса (30 г), один мегабайт – мешок (30 кг), один гигабайт – это грузовик с прицепом (30 тонн), один терабайт – семь грузовых железнодорожных составов (30000 тонн), один петабайт – сто морских сухогрузов (30 млн. тонн). Разговор о «больших данных» начинается с данных объемом в десятки и сотни петабайт.

Откуда берутся большие данные? В этой части лекции самое главное донести до школьников, что большие данные во многом производим мы сами, когда совершаем покупки, говорим по телефону, общаемся в мессенжерах, играем в онлайн-игры, слушаем музыку или читаем электронную книгу. Даже наше перемещение по городу с мобильным устройством в кармане и фитнес-браслетом на запястье генерирует некоторый объем данных, передаваемый на серверы.

В этом месте очень важно поговорить о безопасности данных и нашей личной безопасности. Жизнь новых поколений значительно изменится благодаря «революции данных». И эти изменения могут иметь как положительный, так и отрицательный оттенок [2]. Использование интернета для организации международных программ общения и обучения школьников, расширяет возможности детей. Но персональные данные детей, которые попадают в сеть, могут использоваться третьими лицами для неизвестных целей. Приведем один лишь пример. В 2015 году фирма Mattel выпустила «smart» Барби, которая через смартфон, подключается к интернету и может быть использована как голосовой помощник ребенка, аналогично Apple Siri или Алисы в Яндекс. Фирма, разработавшая эту куклу, не скрывает того, что детские голоса собираются на серверах и могут быть переданы третьим лицам.[3].

Важной частью обсуждения является рассказ о специалисте в области обработки больших данных. Каким он должен быть? Что знать? Где учиться?

Для участия в научно-популярных лекциях для школьников можно подключать студентов профильных направлений. На факультете КНиИТ СГУ в рамках дисциплины «Введение в специальность» первокурсники выполняют научно-популярные проекты, связанные с разными областями IT-сферы, в том числе, и с машинным обучением. По итогам защиты отбираются лучшие проекты, которые затем представляются в школах города и на дне открытых дверей факультета.

Следующим направлением работы является подготовка школьников к участию в научно-практических конференциях. Тема больших данных и машинного обучения является достаточно сложной для такого вида взаимодействия со школьниками, но вместе с тем очень интересной и современной, имеющей огромное прикладное значение. Конечно, такая работа не ведется «с нуля» и подготовку к конференции нужно начинать заранее. Логично, если первым этапом будет прослушивание научно-популярных лекций и/или посещение элективного курса. Вместе с тем, все больше и больше школьников, которые начинают самостоятельно проявлять интерес к данной теме, получив информацию из сети Интернет, СМИ и т.д., поучаствовав в открытых интернет-уроках (https://ai.proektoria.online/). Например, в 2017-2018 году ученики Физико-технического лицея города Саратова выполнили и представили на конкурс научно-популярные проекты по темам «Нейронные сети», «Компьютерное зрение», «Искусственный интеллект», а в 2018 году в Лицее математики и информатике десятиклассник создал программу для распознавания букв.

В настоящий момент сотрудники факультета КНиИТ СГУ разрабатывают программу и содержание элективного курса для создаваемого предуниверситария «Основы искусственного интеллекта». Занятия по данной теме будут проводиться как в теоретической, так и в практической форме. На теоретических занятиях будут даваться основные понятия, связанные с машинным обучением, анализом больших данных, распознаванием и т.д. На простых примерах будет показано, что такое нейронная сеть, дерево решений, рекомендательная система. На практических занятиях планируется использование Python с упором на библиотеки numpy, pandas, matplotlib [4]. Элементы этого курса были опробованы в текущем 2017-18 учебном году на спецкурсе для 11-классников в Лицее математики и информатики г. Саратова.

Преподаватели факультета КНиИТ СГУ, работающие не только со студентами, но и с детьми, видят перспективу в ознакомлении школьников 8 – 11 классов с основами машинного обучения и работы с большими данными. Используя большие данные, мы можем показать, что выявлять закономерности и работать с ними может и школьник. А в итоге мы можем продемонстрировать детям, что учиться интересно.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *