11 идей проектов по машинному обучению для начинающих
Программирование

11 идей проектов по машинному обучению для начинающих

Эти идеи проектов отлично подходят для тех, кто обладает некоторыми знаниями в области программирования и хочет пробиться в сферу машинного обучения

Машинное обучение широко и применимо во многих областях. Поэтому вы можете заблудиться, пытаясь найти точку опоры как новичок. Тем не менее, занятие проектами во время учебы поможет вам определить свои интересы и сосредоточиться на определенном пути

Кроме того, это позволит вам ознакомиться с типичным рабочим процессом машинного обучения

Здесь мы покажем вам несколько лучших идей проектов для начинающих, которые помогут вам глубже погрузиться в тонкости машинного обучения

1. Прогнозирование кредитов

Многие кредитные и банковские приложения теперь включают в себя модели приемлемости кредитов. Так что это вдохновляющий угол зрения, с которого можно начать, если вы заинтересованы в применении машинного обучения к уже имеющимся знаниям в области финтеха

Однако вы вряд ли сможете масштабировать это для внедрения в приложения. Но вы узнаете, как большинство корпоративных приложений решают, подходит ли человек для получения кредита или нет

Для начала вам понадобится набор данных, содержащий некоторую финансовую информацию. Используя тенденции заработка и расходов в этих данных, вы обучите свою модель изучать определенные закономерности и предсказывать право на получение кредита, когда она получит новую информацию

2. Анализ настроений

Поиграть с анализом настроений – отличная идея, особенно если вы разбираетесь в написанных словах

Если вы запутались, анализ настроений включает в себя классификацию или кластеризацию текста машиной, обычно на положительные и отрицательные оценки

Как и во многих проектах, связанных с естественным языком, выбор признаков и здесь может оказаться несколько сложной задачей. Но анализ настроений в тексте часто начинается с текстового майнинга для изучения закономерностей рассматриваемых текстов. Это позволит вам определить основные признаки в вашем наборе данных, которые вы сможете использовать в качестве критериев обучения

Затем вы можете использовать соответствующие алгоритмы классификации, такие как Naive Bayes или дерево решений, для обучения вашей модели. В конечном счете, этот проект познакомит вас с основными понятиями работы с текстом и с тем, как работает обнаружение спама

Python предлагает тонну гибких алгоритмов и логики вокруг анализа настроений. Поэтому, если вам удобно работать с Python, который относительно прост в освоении, вы можете посмотреть, как использовать инструментарий для обработки естественного языка

3. Код модели логистической регрессии

Логистическая регрессия – это простая модель классификации, идеально подходящая для начинающих. Как вы, возможно, уже знаете, она находит вероятность наступления дискретных событий

Вы можете начать с работы с наборами данных, содержащими дискретные значения, такие как ‘Да’ и ‘Нет’, или ‘Хорошо’ и ‘Плохо’. Как и другие алгоритмы классификации, логистическая регрессия поможет вашей машине закодировать их в удобочитаемые значения, чтобы она могла правильно предсказывать

А если вы хотите предсказать более двух возможных исходов, вы можете углубиться в мультиномиальную логистическую регрессию. И все же, scikit-learn из Python может быть довольно удобным инструментом для написания вашей модели

4. Распознавание изображений

Такие технологии, как распознавание лиц и обнаружение поддельных изображений, могут показаться волшебством. Но когда вы увлечетесь проектом ‘Сделай сам’ по распознаванию изображений, вы вскоре поймете, что создать такую систему проще, чем вы могли подумать

Более того, в вашем распоряжении довольно большое количество библиотек машинного обучения для обработки изображений.TensorFlow, например, предлагает универсальные ресурсы для моделирования изображений

И если TensorFlow сложен для понимания, то Keras, часть платформы TensorFlow, также является ценным инструментом, который вы можете использовать. В конечном счете, базовое понимание искусственных нейронных сетей (ИНС) будет полезно для этого проекта

Однако ваш проект по распознаванию изображений может варьироваться от обнаружения поддельных изображений до алгоритмов распознавания изображений

Хотя поначалу это кажется утомительным, по мере углубления в процесс становится все проще. Кроме того, это даст вам твердое понимание концепций глубокого обучения

5. Классификация и прогнозирование рака

Классификация рака – интересная тема для изучения, особенно если вы заинтересованы в применении знаний машинного обучения в таких областях медицины, как биоинформатика

Ваши данные, как правило, содержат стандартные метрики для определения доброкачественности или злокачественности опухоли. Затем вы будете использовать эту информацию для создания модели, которая классифицирует новые случаи рака в соответствующую категорию, используя те же метрики. В зависимости от того, как вы собираетесь подходить к этому, вы можете использовать алгоритм классификации, такой как дерево решений, чтобы информировать машину о принятии решения

А если вы хотите пополнить существующие знания, вы можете даже углубить свой проект, углубившись в предсказание рака. Здесь для достижения своей цели вы можете использовать такие алгоритмы, как машины опорных векторов (SVM) и искусственные нейронные сети (ANN)

6. Прогнозирование цен на акции (кластеризация)

Фондовый рынок нестабилен, и цены на нем зависят от множества различных факторов. Поэтому определение прибыльной акции иногда может стать нелегкой битвой для инвесторов

Поскольку вы решаете проблему, связанную с финансами, и в то же время изучаете основные концепции машинного обучения, этот проект стоит вашего времени

Ваш набор данных должен содержать информацию о различных акциях и их изменениях с течением времени. Поскольку изучение закономерностей более эффективно, ваша модель будет использовать эту информацию для предсказания того, упадет или вырастет акция в определенный момент времени. Таким образом, это также связано с анализом временных рядов, поскольку ваша модель будет прогнозировать будущие результаты

И, к счастью, в вашем распоряжении множество инструментов для этого проекта. Например, Prophet от Facebook – это инструмент прогнозирования с открытым исходным кодом. Вы можете использовать его с помощью Python. Но если вам удобнее работать с R, Prophet также широко поддерживает R

7. Прогнозирование ниши сайта

Это не очень популярный проект для новичков. Но вы можете принять его, если вам нравятся вызовы и вы хотите раскрыть инструменты, которые можно использовать для достижения своей цели

Одна из трудностей, с которой вы можете столкнуться в этом проекте, – где взять наборы данных. Но как только вы выясните, какая информация вам нужна для решения проблемы, вы сможете собрать данные, используя этот учебник BeautifulSoup

Похожие:Уникальные способы получения данных для проекта машинного обучения

Чтобы это сработало, необходимо учитывать такие метрики, как заголовки на веб-странице. Кроме того, обратите внимание на часто используемые предложения и ключевые слова, поскольку они, по крайней мере, указывают на то, о чем идет речь на веб-странице. Это означает, что вы должны тщательно выбирать характеристики для достижения разумной точности

8. Построение рекомендательной системы с помощью Python

Вы наверняка сталкивались с рекомендательными системами, когда просматривали интернет или пользовались такими приложениями, как YouTube и Netflix. Большинство рекламных систем в интернете также используют их для фильтрации рекламы, которую вы видите— и иногда кажется, что интернет знает, о чем вы думаете

В некоторых случаях, основываясь на том, что вы часто ищете в Интернете, система рекомендаций может узнать о ваших предпочтениях в контенте. Затем он использует это, чтобы рекомендовать связанный контент, который, по его мнению, может вас заинтересовать

Ваша система может быть не такой сложной. Но вы можете создать что-то базовое для начала работы. Например, рекомендатель продуктов – отличное начало

Например, для создания рекомендателя продуктов необходимо собрать данные о продуктах и представлениях людей о них. Это, конечно, могут быть такие данные, как количество положительных и отрицательных отзывов, ниша продукта, количество покупок и многое другое

9. Прогнозирование качества вина

Прогнозирование качества вина – один из немногих проектов, ориентированных на новичков. Это задача классификации, включающая деление вина на высококачественное и низкокачественное

Для этого вы можете использовать алгоритмы классификации, такие как логистическая регрессия или дерево решений для обучения вашей модели. Вы даже можете использовать ANN, если вы заинтересованы в соединении всех точек для принятия решений

Как и любой другой проект по машинному обучению, этот проект познакомит вас с основными понятиями выбора признаков, корреляции, кодирования меток и другими. Кроме того, это дает вам возможность выравнивать свои данные

10. Постройте простой алгоритм машинного обучения

Хотя до этого момента мы рекомендовали проекты, использующие другие алгоритмы, вы можете написать алгоритм ‘сделай сам’ с нуля, используя языки, дружественные к ML, такие как C, C++, R или Python

Хотя это может показаться немного сложнее, чем другие задачи в списке, это идеальная идея проекта, особенно если вы хотите узнать, как работают встроенные алгоритмы и итерации в ваших данных

Конечно, это не обязательно должен быть сложный алгоритм. Например, вы можете изучить математическую концепцию, лежащую в основе простой линейной регрессии, и использовать ее для создания применимого, многократно используемого и устанавливаемого алгоритма

11. Обнаружение фальшивых новостей

Не новость, что фальшивые и подлинные новости разлетаются по сети. Но у обоих есть уникальные указатели и атрибуты, которые позволяют отнести их к той или иной категории

Поскольку вы имеете дело с обычными текстами, поиск уникального описательного шаблона для обоих типов новостей может помочь вам в достижении вашей цели. Вы должны тщательно выбрать свой признак, чтобы избежать перегрузки или недогрузки модели

Для этого вопроса вы можете начать с изучения документации по инструментарию естественного языка, в котором есть много ресурсов, которые вы можете использовать для обработки текста

Учитесь на практике и станьте экспертом в области машинного обучения

Независимо от того, являетесь ли вы самоучкой, посещаете курсы или учитесь в школе, вы можете потерять понимание основных концепций, если не будете применять полученные знания на практике

Хотя машинное обучение кажется сложным, с помощью личных проектов вы лучше поймете жизненный цикл реальных проектов и связанные с ними трудности. Таким образом, вам будет проще маневрировать, когда вы столкнетесь с реальными проблемами

Об авторе

Алексей Белоусов

Привет, меня зовут Филипп. Я фрилансер энтузиаст . В свободное время занимаюсь переводом статей и пишу о потребительских технологиях для широкого круга изданий , не переставая питать большую страсть ко всему мобильному =)

Комментировать

Оставить комментарий