Devdays Осень 2016 — различия между версиями

Материал из SEWiki
Перейти к: навигация, поиск
(Темы проектов)
Строка 44: Строка 44:
  
 
Предложил: Михаил Кольцов
 
Предложил: Михаил Кольцов
 +
 +
== Генератор скриптов для контрольных по bash ==
 +
 +
Многие задачи на контрольной и в домашних работах были достаточно шаблонными и можно было их разбить на подзадачи (например: получаем данные | выделяем регулярное выражение | обработка sed'ом/awk | вывод). Почему бы и не попробовать написать и обучить систему, которая может решать такие простые задачи?
 +
 +
Технологии: python, bash
 +
 +
Предложил: Мыров Владислав

Версия 12:09, 22 октября 2016

Темы проектов

Чтобы править эту страницу, нужно залогиниться в Sewiki. Тогда сверху будет кнопочка "править". Если у вас нет учётной записи - напишите Мише Кольцову желаемый логин.

Редактировать wiki одновременно нескольким людям стоит осторожно: после внесения правки проверьте, что она действительно сохранилась.

Проекты нумеруются автоматически. Можно вписывать свои идеи проектов в порядке, отличном от "первый вписал - меньше номер".

Определение проплаченных отзывов к товарам

В интернете представлено много товаров и услуг. Часто потенциальные клиенты ориентируются на отзывы (на сайте компании или на тематических каталогах). Отсюда появился бизнес по "накрутке" отзывов: себе пишем получше, конкурентов втаптываем.

Я и сам смотрю на отзывы. Поэтому есть интерес в том, чтобы они были "честными".

Давайте возьмём русскоязычные отзывы из конкретной области и научимся определять, какие из них являются проплаченными. Или подозрительными. Скажем, возьмём все отзывы к микроволновкам с Я.Маркета.

Технологии: python (библиотеки: sklearn, NLTK, bs4, ...), анализ текстов (Mystem, ...)

Предложил: Михаил Кольцов

Поиск деликатных данных в открытых источниках

Есть много сайтов, на которых пользователи могу добавлять свои документы и медиафайлы. Иногда другие неавторизованные пользователи могут смотреть на эти файлы. Некоторые люди думают, что если ни у кого нет ссылки, то никто не видит их файлов. Давайте это исправим!

Сделаем программу, которая тыкается в случайные страницы на ideone, paste.ubuntu.com, google drive, cloud.mail.ru, ..., и собирает с них информацию. Пароли, конфигурация, топология локальной сети, обнажённые фотографии - что угодно.

Например, я случайно ткнулся на paste.ubuntu.com и получил информацию о чьей-то сломанной файловой системе.

Технологии: python

Предложил: Михаил Кольцов

Twitter-бот для ответов на жалобы

Сейчас у многих компаний есть представительство в Twitter. К примеру, если какой-то пользователь пишет "вот ведь в мегафоне чудаки", то специально обученные сотрудники Мегафона ему могут ответить: что не так, как нам исправить свою ошибку и т.п.

Давайте сделаем бота, который будет отвечать что-то осмысленное на жалобы русскоязычных пользователей. Представим, что мы - какая-то конкретная компания. Будем "слушать" твиты с упоминанием это компании и пытаться понять смысл. И отвечать что-нибудь успокаивающе-положительное, связанное с текстом жалобы.

Технологии: python

Предложил: Михаил Кольцов

Генератор скриптов для контрольных по bash

Многие задачи на контрольной и в домашних работах были достаточно шаблонными и можно было их разбить на подзадачи (например: получаем данные | выделяем регулярное выражение | обработка sed'ом/awk | вывод). Почему бы и не попробовать написать и обучить систему, которая может решать такие простые задачи?

Технологии: python, bash

Предложил: Мыров Владислав