Telestorm

Главная

Стикеры

Каналы

Telestorm

R4marketing | канал Алексея Селезнёва | Язык R

Автор канала Алексей Селезнёв, украинский аналитик, автор ряда курсов по языку R и пакетов расширяющих его возможности. В канале публикуются статьи, доклады, новости, заметки по языку R. Для связи: @AlexeySeleznev Реклама: http://bit.ly/39MwJCY

Язык

Русский

Категории

Технологии

R4marketing | канал Алексея Селезнёва | Язык R

​​​​👨‍💻 The Fundamentals of People Analytics: With Applications in R\nНовая книга The Fundamentals of People Analytics: With Applications in R, находящая в открытом доступе, предназначена для аналитиков всех уровней и поможет им эффективно решать задачи, связанные с управлением персоналом организаций. В ней представлены ключевые идеи и концепции, охватывающие весь аналитический цикл, а также подробные инструкции по использованию R для решения реальных задач. Не требуются предварительные знания статистики, баз данных или программирования. Первые главы посвящены введению в R и SQL, а также основам статистики.\nЧеловеческий капитал является самым важным активом любой организации. Без знаний и навыков сотрудников организация не сможет достичь успеха. Привлечение, развитие и удержание талантливых сотрудников становится все более сложной и ответственной задачей, поэтому организации делают значительные инвестиции в углубленное понимание организационных явлений на основе данных, влияющих на конечные результаты.\nПрочитав книгу, вы сможете:\n1. Планировать и проводить эмпирические исследования.\n2. Запрашивать и обрабатывать данные с использованием SQL.\n3. Очищать и анализировать данные с помощью R.\n4. Применять соответствующие статистические и ML-модели для широкого спектра задач аналитики в области управления персоналом.\n5. Представлять результаты анализа и осуществлять коммуникацию со стейкхолдерами на основе данных.\n#books #people_analytics #R


0
711

qdapRegex - извлечение, замена и удаление частей текста\nРегулярные выражение инструмент достаточно мощный, но в тоже время и довольно непростой в понимании. Поэтому, для извлечения/удаления/замены каких-то базовых паттернов в тексте, например имейлов, номеров телефонов, почтовых индексов. чисел, дат, аббревиатур и т.д. можно использовать пакет qdapRegex.\nКаждая из функций пакета имеет приставку, в зависимости от её назначения:\n● ex_*() - извлечение части текста\n● rm_*() - удаление / замена части текста\nНапример, в одном из постов канала я показал, как с помощью регулярных выражений удалить часть текста между двумя символами, задача казалось бы простая, но регулярное выражение для её выполнения будет не самым простым, а пакет qdapRegex решает такие задачи очень просто:\nlibrary(qdapRegex)<br/><br/>x <- "I like [bots] (not)."<br/><br/>rm_between(x, "(", ")")<br/>ex_between(x, "(", ")")<br/>rm_between(x, c("(", "["), c(")", "]"))<br/>ex_between(x, c("(", "["), c(")", "]"))<br/><br/>\nЕсли вам не удалить, а заменить часть текста используйте аргумент replacement:\nrm_between(x, "[", "]",replacement = "humans")<br/><br/>\nНиже приведу набор наиболее полезных функций:\n● (ex|rm)__between() - часть текста между указанными символами\n● (ex|rm)_hash() - хештеги\n● (ex|rm)_tag() - именные теги (@username)\n● (ex|rm)_url() - извлечение ссылок из текста\n● (ex|rm)_email() - имейлы\n● (ex|rm)_phone() - номера телефонов\n● (ex|rm)_emoticon() - смайлы\n● (ex|rm)_bracket() - текст внутри квадратных, фигурных или круглых скобок\n● (ex|rm)_curly() - текст внутри фигурных скобок\n● (ex|rm)_round() - текст внутри круглых скобок\n● (ex|rm)_square() - текст внутри квадратных скобок\n● (ex|rm)_number() - числа\n● (ex|rm)_time() - время\n● (ex|rm)_date() - даты\n● (ex|rm)_non_words() - не слова\n● (ex|rm)_nchar_words() - слова более заданной длинны\n● (ex|rm)_repeated_characters() - повторяющиеся символы\nИ это не полный набор функций, пакет будет крайне полезен для очистки текста. или извлечения нужной информации из неструктурированного текста, например из имейлов, или комментариев.\n# пример текста<br/>text <- "@alex привет, отправь 12.07.2023 @john информацию о стоимости #iphone на почту j.smith@corp.com потом позвони мне (067)123-45-67"<br/><br/>ex_date(text) # извлекаем дату<br/>ex_email(text) # извлекаем имейл<br/>ex_hash(text) # извлекаем хеш<br/>ex_tag(text) # извлекаем теги<br/>ex_phone(text) # извлекаем номер телефона?<br/><br/>\nВсе функции под капотом используют американский словарь регулярных выражений, получить его можно командой data(regex_usa). Но вы можете создать и использовать собственный словарь регулярных выражений, в примере выше мы не смогли извлечь номер телефона, потому что его описание в тексте не соответствует американскому словарю регулярных выражений, давай создадим свой словарь:\n# создаём словарь<br/>regex_dict <- list("rm_phone" = "\\\\(\\\\d{3}\\\\)\\\\d{1,4}-\\\\d{1,4}-\\\\d{1,4}")<br/># устанавливаем пользовательский словарь по умолчанию<br/>options("regex.library" = regex_dict)<br/># используем словарь и паттерн из него<br/>ex_phone(text, pattern = "@rm_phone")<br/><br/>\nПользуйтесь!\n#заметки_по_R


0
1,150

Создание API в R при помощи Plumber\nЯ считаю лучшим способом для интеграции приложений R в любую систему ПО, — это Plumber. Статья посвящена именно ему. К ее завершению вы создадите в R свой первый API при помощи Plumber.\nСодержание:\n1. Пара слов об использовании R в продакшене\n2. Что такое API?\n3. Как работает Plumber?\n4. Начнем с простого скрипта\n5. Превращение скрипта в API\n6. Проверим\n7. Развертывание\n8. Заключение\n#статьи_по_R


0
2,150

0


0
2,050

Язык R: прокачайте свои навыки до следующего уровня\nАвтор: Андрей Шагин\nВ статье приводятся 7 рекомендаций по оптимизации кода в плане использования и времени выполнения ваших скриптов, говоря простыми словами, рекомендации по повышени. эффективности вашего кода.\nСодержание:\n● Рекомендация 1. Выполняйте профилирование кода\n● Рекомендация 2. Векторизируйте код\n● Рекомендация 3. Матрицы вместо фреймов данных\n● Рекомендация 4. is.na() и anyNA\n● Рекомендация 5. if() … else() вместо ifelse()\n● Рекомендация 6. Параллельные вычисления\n● Рекомендация 7. Интерфейс сопряжения R с другими языками\n● Заключение\n#статьи_по_R


0
2,150

Видео урок: Как хранить и работать с секретными данными на языке R\nНовички зачастую хранят все секретные данные, такие как пароли и api токены, непосредственно в коде, но это считается плохой практикой. \nОпубликовал видео в котором рассказал почему не стоит хранить пароли в самом коде. и как правильно и безопасно хранить секретные данные.\nТайм коды:\n00:00 Вступление\n00:39 Что такое секретные данные\n01:06 Как не надо хранить секретные данные\n03:18 Способы хранения и работы с секретными данными\n03:54 Работа с хранилищем учётных данных операционной системы с помощью пакета keyring\n06:40 Работа с файлами конфигурации с помощью пакета configr: yaml, ini, json\n14:24 Работа с переменными среды\n18:35 Заключение \nДлительность: 19:10\nСсылки:\n- Материалы к уроку\n- Видео\n#видео_уроки_по_R


0
2,250

🤖 Краш-тест возможностей chatGPT-4 для создания визуализации данных в R с помощью ggplot2\nGPT-4 можно использовать для улучшения визуализации данных в R (ggplot2), что делает его отличным инструментом как для начинающих, так и для продвинутых пользователей R. Мне понравилось, как автор видео общается с chatGPT-4. Хотя код на R иногда содержит ошибки и не работает, весь процесс выглядит очень захватывающим. От создания базовых графиков (смотрите с какой легкостью chatGPT пишет код для пайчарта 🙊 на зависть новичкам) до продвинутых техник использования ChatGPT для поиска данных, анализа и визуализации данных.\n▶️ Видео Using GPT-4 for Data Viz (R/ggplot).\nМораль: Как мне кажется, с появлением AI люди НЕ потеряют способность к абстрактному мышлению, анализу, или креативность. Использование chatGPT только повысит производительность труда и качество работы человека. \n#R #ggplot2 #chatGPT4 #визуализация_данных #dataviz #полезное


0
2,150

ОН КЛИНИК в поиске Middle Web analyst\nКурсы по программингу на Python или R будут плюсом.\nЗадачи:\n● Поддерживать сквозную аналитику по интернет-продажам услуг в разрезе источников и каналов привлечения, типов услуг, затрат на привлечение (онлайн- и оффлайн-воронки);\n● разработка персонализированных отчетов для отдела маркетинга;\n● построение Ad-Hoc отчётов;\n● подготовка технических заданий для разработчиков и контроль их выполнения;\n● багфикс/багрепорты по работе систем веб-аналитики;\n● настройка тегов в Google Tag Manager;\n● настройка целей, представлений в Google Analytics;\n● анализ эффективности всех каналов трафика и подготовка предложений по оптимизации бюджетов и повышению уровня конверсии;\n● аналитика поведения пользователей и предложения по оптимизации удобства использования и поведенческого опыта;\n● разработка гипотез и проведение А/В-тестирований;\n● контроль и поддержание единой логики использования UTM-меток;\n● создание и поддержание актуальности отчетов маркетинговой аналитики на базе BI решений, которые позволят проводить аналитику всех каналов маркетинга с учетом реальных доходов от продаж услуг. \nТребования к кандидату:\n● уверенный пользователь Google Analytics, Google Tag Manager;\n● уверенное владение SQL, Python или R, Google BigQuery;\n● опыт работы с API (настройка сбора данных и интеграции с внешними системами), контроль разработки и внедрения с командой программистов;\n● знание систем визуализации данных Power BI, Google Data Studio;\n● знание различных типов моделей атрибуции, опыт их внедрения, анализ результата и принятия решений по их эффективности;\n● опыт работы с большими объемами данных.\nGEO- Украина.\nДетали вакансии в личных сообщениях: tg @dariaviatorem


0
1,650

ggflowchart: Создание блок-схем в R\nПакет ggflowchart является надстройкой над ggplot2, которая позволяет с минимальным объёмом кода рисовать блок схемы, средствами одного чистого ggplot2 сделаьт это не так просто.\nРисование блок схемы проходит в 2 этапа:\n1. Сначала создать таблицу с описанием будущей блок схемы:\nlibrary(ggflowchart)<br/><br/>data <- tibble::tibble(from = c("A", "A", "A", "B", "C", "F"),<br/> to = c("B", "C", "D", "E", "F", "G"))<br/><br/>\n2. С помощью функции ggflowchart() нарисовать саму блок-схему\nggflowchart(data)<br/><br/>\nФункция ggflowchart() так же имеет набор дополнительных аргументов:\n● node_data - Необязательный фрейм данных, определяющий атрибуты узла, включая метки, которые должны отображаться в полях.\n● fill - Цвет заливки блоков узлов.\n● colour - Цвет контура блоков узлов.\n● text_colour - Цвет текста в полях узла.\n● text_size - Размер текста в полях узла.\n● arrow_colour -Цвет стрелок между блоками узлов.\n● arrow_size - Размер стрелок между блоками узлов.\n● family - Семейство шрифтов текста в полях узла.\n● x_nudge - Ширина блоков узлов.\n●` y_nudge` - Высота блоков узлов.\n● horizontal - Направление блок-схемы\nПреобразуем приведённую выше блок схему с помощью аргумента node_data:\nnode_data <- tibble::tibble(<br/> name = c("A", "B", "C", "D", "E", "F", "G"),<br/> type = c("Type 1", "Type 1", "Type 1", "Type 1", <br/> "Type 2", "Type 2", "Type 2")<br/> )<br/>ggflowchart(data, node_data, fill = type)<br/><br/>\nРезультат можно увидеть на изображении к посту.\nСсылки:\n- Примеры кода заимствованы из статьи "Introducing {ggflowchart}"\n#заметки_по_R


0
1,450

Туториал по языку R от ravesli\nR — это язык программирования с открытым исходным кодом, который широко используется как статистическое программное обеспечение и инструмент анализа данных. R обычно поставляется с интерфейсом командной строки и доступен на широко используемых платформах, таких как Windows, Linux и macOS.\nСодержание:\n1. Введение в язык программирования R\n2. Интересные факты о языке программирования R\n3. Язык R в сравнении с Python\n4. Окружения в R\n5. Как установить R-Studio в Windows и Linux?\n#статьи_по_R


0
1,850

Добавить

КаналСтикеры

Наши Боты

@telestormauthbot

© Telestorm.ru 2020-2024 Все права защищены

TwitterYouTubeInstagram