Книги по DataScience и BigData, разработка баз данных, нереляционные базы данных nosql скачать бесплатно
Книги по DataScience и BigData, разработка баз данных, нереляционные базы данных nosql скачать бесплатно
Литература ⇒ Базы данных ⇒ DataScience и BigData
Большиие данные (big data) — обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия,
эффективно обрабатываемых горизонтально масштабируемыми (англ. scale-out) программными инструментами, появившимися в конце 2000-х годов
и альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence.
В широком смысле о «больших данных» говорят как о социально-экономическом феномене, связанном с появлением технологических возможностей
анализировать огромные массивы данных, в некоторых проблемных областях — весь мировой объём данных, и вытекающих из этого трансформационных
последствий.
Наука о данных (data science, иногда «даталогия») — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме.
Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические методы, методы интеллектуального анализа данных и
приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных.
Рассматривается как академическая дисциплина, а с начала 2010-х годов, во многом благодаря популяризации концепции «больших данных», — и как практическая
межотраслевая сфера деятельности, притом специализация «учёного по данным» (англ. data scientist)
с начала 2010-х годов считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий.
DataScience и BigData, разработка баз данных, большие данные, нереляционные базы данных nosql -
на данной странице вы можете ознакомиться и скачать книги и литературу для обучения в работе совершенно бесплатно
Всего записей в разделе литература - 1696 (найдено книг: 24)
Работа с BigData в облаках
Сенько А., Питер, 2019, 448 c.
Перед вами — первая исходно русскоязычная книга, в которой на реальных примерах рассматриваются секреты обработки больших данных (Big Data) в облаках. Основное внимание уделено решениям Microsoft Azure и AWS. Рассматриваются все этапы работы — получение данных, подготовленных для обработки в облаке, использование облачных хранилищ, облачных инструментов анализа данных. Особое внимание уделено службам SAAS, продемонстрированы преимущества облачных технологий по сравнению с решениями, развернутыми на выделенных серверах или в виртуальных машинах.
Теоретический минимум по Big Data. Всё что нужно знать о больших данных
Су Кеннет , Анналин Ын, Питер, 2019, 208 c.
Неважно, кто вы деловой человек, работающий с аналитикой, начинающий программист или разработчик, «Теоретический минимум по Big Data» позволит не утонуть в бушующем океане современных технологий и разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных. Хотите узнать о больших данных и механизмах работы с ними? Каждому алгоритму посвящена отдельная глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Большое количество иллюстраций и простые комментарии позволят легко разобраться в самых сложных аспектах Big Data.
Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub
Рассел М., Классен М., Питер, 2019, 466 c.
В недрах популярных социальных сетей — Twitter, Facebook, LinkedIn и Instagram — скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker. Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере Twitter.
Data Science. Инсайдерская информация для новичков
Шатт Рэйчел, О’Нил Кэти, Питер, 2019, 368 c.
Data Science (исследование данных) - одна из самых востребованных специализаций нашего времени. Изучение данных позволяет преобразить любую традиционную или инновационную бизнес-модель. Эта книга основана на вводном курсе по Data Science из Колумбийского университета, и начинающему специалисту-аналитику она совершенно необходима. Эта книга увлекательно и доступно рассказывает о байесовском методе, статистических алгоритмах, финансовом моделировании, рекомендательных движках, визуализации данных, MapReduce. С примерами на языках Python и R.
Знакомство с машинным обучением и библиотекой TensorFlow похоже на первые уроки в автошколе, когда вы мучаетесь с параллельной парковкой, пытаетесь переключить передачу в нужный момент и не перепутать зеркала, лихорадочно вспоминая последовательность действий, в то время как ваша нога нервно подрагивает на педали газа. Это сложное, но необходимое упражнение. Так и в машинном обучении: прежде чем использовать современные системы распознавания лиц или алгоритмы прогнозирования на фондовом рынке, вам придется разобраться с соответствующим инструментарием и набором инструкций, чтобы затем без проблем создавать собственные системы.
Искусственный интеллект становится неотъемлемым атрибутом современного мира, управляемого технологиями и данными. Он интенсивно применяется в таких областях, как поисковые системы, распознавание образов, робототехника, беспилотные автомобили и т.п. В этой книге исследуются различные сценарии, взятые из реальной жизни. Прочитав ее, вы будете знать, какие алгоритмы искусственного интеллекта следует применять в том или ином контексте. Книга содержит множество примеров, охватывающих очень широкий спектр разработок, ведущихся в этой области. Вы узнаете о том, как реализовать алгоритмы, обеспечивающие получение наилучших результатов в зависимости от специфики задачи, и увидите, как они применяются в реальных сценариях
Большие данные - ключевой элемент современного информационного пространства. Практически все, что делает отдельный человек, группы людей, человечество в целом, компании из разных сфер бизнеса, правительства, происходит в рамках глобального информационного поля. Наша работа, наш досуг, шопинг, путешествия - всё тем или иным способом связано с большими данными. Мы получаем и отправляем письма по электронной почте, мы звоним по телефону и звонят нам, мы сёрфим в Интернете и таким образом получаем и отправляем биты информации и находимся внутри системы больших данных. Книга рассказывает о практическом применении технологии в торговле и банковском деле, медицине и метеорологии, о том, как большие данные помогают обеспечивать безопасность, предсказывать погоду и заставляют нас делать покупки.
Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow
Орельен Ж., Диалектика, 2019, 683 c.
Эта книга предполагает, что вы почти ничего не знаете о машинном обучении. Её цель — определить концепцию, методы и инструменты, необходимые для реализации программ, которые помогут изучать массивы данных. Используя конкретные практические примеры, с минимумом теории, а также две библиотеки для Python — Scikit-learn и TensorFlow вы сможете получить интуитивное понимание концепций и инструментов для построения интеллектуальных систем. Вы изучите целый ряд методов, начиная с простой линейной регрессии и заканчивая глубокими нейронными сетями. А упражнения, представленные в каждой главе, помогут вам применять изученный материал на практике.
Прагматичный ИИ. Машинное обучение и облачные технологии
Ной Гифт, Питер, 2019, 304 c.
Книга Ноя Гифта 'Прагматичный ИИ: Машинное обучение и облачные технологии' предназначена для всех, кого интересуют ИИ, машинное обучение, облачные вычисления, а также любое сочетание данных тем. Как программисты, так и не-программисты найдут тут для себя крупицы полезной информации. Многие студенты, с которыми автор пересекался на семинарах в NASA, PayPal и в Калифорнийском университете в Дэвисе, смогли усвоить эти идеи даже при очень ограниченном опыте программирования или вообще без такового. В данной книге активно используется Python — один из лучших языков для новичков в программировании. В то же время здесь рассматривается множество таких продвинутых тем, как использование платформ облачных вычислений (например, AWS, GCP и Azure), а также программирование машинного обучения и ИИ. Продвинутые технологи, свободно владеющие Python, облачными вычислениями и машинным обучением, тоже найдут для себя много полезных идей, которые смогут сразу применить в своей текущей работе.
Если у вас уже есть положительный опыт использования Spark для решения небольших задач, но вы по-прежнему ломаете голову – где та самая непревзойденная производительность Spark, позволяющая перемалывать колоссальные объемы данных – то эта книга для вас. Она расскажет, как эффективно использовать Spark для укрощения больших данных и вырасти из новичка в специалиста. Идеально подходит для программистов, инженеров по работе с данными, системных администраторов, обслуживающих крупномасштабные приложения.