Devdays Осень 2016 — различия между версиями
Mkoltsov (обсуждение | вклад) (Новая страница: « = Темы проектов = Чтобы править эту страницу, нужно залогиниться в Sewiki. Тогда сверху буд…») |
Mkoltsov (обсуждение | вклад) |
||
Строка 18: | Строка 18: | ||
Технологии: python (библиотеки: [http://scikit-learn.org/stable/ sklearn], [http://www.nltk.org/ NLTK], [https://www.crummy.com/software/BeautifulSoup/bs4/doc/ bs4], ...), анализ текстов ([https://tech.yandex.ru/mystem/ Mystem], ...) | Технологии: python (библиотеки: [http://scikit-learn.org/stable/ sklearn], [http://www.nltk.org/ NLTK], [https://www.crummy.com/software/BeautifulSoup/bs4/doc/ bs4], ...), анализ текстов ([https://tech.yandex.ru/mystem/ Mystem], ...) | ||
+ | |||
+ | Предложил: Михаил Кольцов | ||
+ | |||
+ | == Поиск деликатных данных в открытых источниках == | ||
+ | |||
+ | Есть много сайтов, на которых пользователи могу добавлять свои документы и медиафайлы. Иногда другие неавторизованные пользователи могут смотреть на эти файлы. Некоторые люди думают, что если | ||
+ | ни у кого нет ссылки, то никто не видит их файлов. Давайте это исправим! | ||
+ | |||
+ | Сделаем программу, которая тыкается в случайные страницы на ideone, paste.ubuntu.com, google drive, cloud.mail.ru, ..., и собирает с них информацию. Пароли, конфигурация, топология локальной сети, обнажённые фотографии - что угодно. | ||
+ | |||
+ | Например, я случайно ткнулся на [http://paste.ubuntu.com/23274534/ paste.ubuntu.com] и получил информацию о чьей-то сломанной файловой системе. | ||
+ | |||
+ | Технологии: python | ||
+ | |||
+ | Предложил: Михаил Кольцов | ||
+ | |||
+ | == Twitter-бот для ответов на жалобы == | ||
+ | |||
+ | Сейчас у многих компаний есть представительство в Twitter. К примеру, если какой-то пользователь пишет "вот ведь в мегафоне чудаки", то специально обученные сотрудники Мегафона ему могут ответить: что не так, как нам исправить свою ошибку и т.п. | ||
+ | |||
+ | Давайте сделаем бота, который будет отвечать что-то осмысленное на жалобы русскоязычных пользователей. Представим, что мы - какая-то конкретная компания. Будем "слушать" твиты с упоминанием | ||
+ | это компании и пытаться понять смысл. И отвечать что-нибудь успокаивающе-положительное. | ||
+ | |||
+ | Технологии: python | ||
Предложил: Михаил Кольцов | Предложил: Михаил Кольцов |
Версия 22:19, 21 октября 2016
Содержание
Темы проектов
Чтобы править эту страницу, нужно залогиниться в Sewiki. Тогда сверху будет кнопочка "править". Если у вас нет учётной записи - напишите Мише Кольцову желаемый логин.
Редактировать wiki одновременно нескольким людям стоит осторожно: после внесения правки проверьте, что она действительно сохранилась.
Определение проплаченных отзывов к товарам
В интернете представлено много товаров и услуг. Часто потенциальные клиенты ориентируются на отзывы (на сайте компании или на тематических каталогах). Отсюда появился бизнес по "накрутке" отзывов: себе пишем получше, конкурентов втаптываем.
Я и сам смотрю на отзывы. Поэтому есть интерес в том, чтобы они были "честными".
Давайте возьмём русскоязычные отзывы из конкретной области и научимся определять, какие из них являются проплаченными. Или подозрительными. Скажем, возьмём все отзывы к микроволновкам с Я.Маркета.
Технологии: python (библиотеки: sklearn, NLTK, bs4, ...), анализ текстов (Mystem, ...)
Предложил: Михаил Кольцов
Поиск деликатных данных в открытых источниках
Есть много сайтов, на которых пользователи могу добавлять свои документы и медиафайлы. Иногда другие неавторизованные пользователи могут смотреть на эти файлы. Некоторые люди думают, что если ни у кого нет ссылки, то никто не видит их файлов. Давайте это исправим!
Сделаем программу, которая тыкается в случайные страницы на ideone, paste.ubuntu.com, google drive, cloud.mail.ru, ..., и собирает с них информацию. Пароли, конфигурация, топология локальной сети, обнажённые фотографии - что угодно.
Например, я случайно ткнулся на paste.ubuntu.com и получил информацию о чьей-то сломанной файловой системе.
Технологии: python
Предложил: Михаил Кольцов
Twitter-бот для ответов на жалобы
Сейчас у многих компаний есть представительство в Twitter. К примеру, если какой-то пользователь пишет "вот ведь в мегафоне чудаки", то специально обученные сотрудники Мегафона ему могут ответить: что не так, как нам исправить свою ошибку и т.п.
Давайте сделаем бота, который будет отвечать что-то осмысленное на жалобы русскоязычных пользователей. Представим, что мы - какая-то конкретная компания. Будем "слушать" твиты с упоминанием это компании и пытаться понять смысл. И отвечать что-нибудь успокаивающе-положительное.
Технологии: python
Предложил: Михаил Кольцов