Что нужно сделать с данными в первую очередь
Работа с информацией. Этап поиска и сбора информации
Продолжим тему «Работа с информацией» и сегодня о первом этапе – Поиск и сбор информации.
Если есть задача/ проблема/ цель, но нет ее решения, — то неизбежно наступает этап поиска этого решения.
И чем правильнее сформулирована проблема, тем проще найти решение.
Если проблема тривиальная, то достаточно одного шага в поиске информации – открываем поисковую систему в Интернете, делаем запрос – и имеем несколько источников информации.
Основной навык, требуемый в этих случаях – правильно составить запрос. Но это тоже нужно сделать грамотно и этому нужно также учиться.
Думаю, что 90 % людей ограничиваются именно этим уровнем работы с информацией. Возникла проблема – зашел в поисковик – получил ответ.
Если задачи не выходят за эти рамки, а именно – найти ответ на бытовой вопрос или быть в курсе новостных событий, — то заморачиваться по поводу выстраивания персональной системы работы с информацией, видимо не стоит.
Для тех же, у кого работа с информацией заключается в необходимости сбора и обработки больших массивов, выраженных в 1 000 единиц файлов или книг, — создание системы работы с информацией будет просто необходимо.
Потребность в системе работы с информацией
У любого специалиста высокого уровня существует своя библиотека знаний.
Знания не имеют границ и требуют постоянного совершенствования и обновления.
Сбор информации в этом случае носит систематический характер. Т.е. информация вносится в базу знаний – постоянно.
Но потребность в системе работы с информацией возникает не только у профессиональных специалистов, возникает она и на бытовом уровне, в личной жизни каждого человека, который стремится к саморазвитию или хотя бы к упорядочению своей жизни.
Жизнь может протекать как сплошной поток непрерывной деятельности. В таком потоке сложно выделить и структурировать отдельные части. Человек живет и все, ему этого достаточно.
Но нашу жизнь можно разнообразить, структурировать наши жизненные цели, придать смысл существованию и всей нашей жизни.
Вам уже скорее всего известен такой инструмент анализа текущего состояния как «Колесо жизни». Оно позволяет оценить вашу текущую ситуацию и определить в каких сферах необходимо развитие.
Таких сфер/направлений может быть несколько (как правило, не более 10): «Здоровье», «Духовное развитие», «Спорт», «Карьера», «Семья», «Финансы» и т.д.
Совершенствование в любой сфере требует знаний. И начинается этот процесс со сбора информации, а именно с формирования личной библиотеки по этим темам.
Итак, наличие системы работы с информацией требуется как на работе, так и в личной жизни. Между работой и личной жизнью, как известно должен быть баланс.
Зачем мы собираем информацию?
Чтобы сбор информации не превратился в самоцель, определимся – зачем же мы собираем информацию.
«… мы собираем информацию не для того, чтобы накапливать знания, а для того, чтобы предпринимать правильные действия», – это сказал гуру менеджмента Питер Ф. Друкер.
Это важно помнить, что сбор информации не ради сбора и не только для накопления знаний, но в итоге – для принятия верных решений и достижения наших целей, независимо на работе или в быту.
Когда, где и как собирать информацию?
Ответим на эти вопросы.
Если формируется база знаний специалиста – то информация пополняется постоянно. Возникла новая информация, привлек внимание заголовок – информация сразу поступает в эту базу.
Можно сформировать папку «Для рассмотрения» и регулярно проводить обработку новой информации, удаляя ненужную, а нужную распределяя по тематическим каталогам вашей системы (о систематизации информации поговорим в следующих статьях).
Если же решается конкретная задача требующая принятия решения, то сбор информации может носить ситуативный характер и быть разовым. Т.е. собрали- проблему решили – получили отчет – отчет на хранение.
Это как управление в Компании: может быть регулярный менеджмент, а может ситуативный. И тот и другой, как ни странно работает.
Но управляемость, прозрачность, отсутствие суеты и стрессов и в конечном итоге — результативность у регулярного менеджмента намного выше.
Т.е. отвечая на вопрос – когда — можно по ситуации, но безусловно лучше – регулярно и используя Технологии.
Где собирать информацию?
Для этого вспомним, что есть информация первичная и вторичная.
Вторичная – это информация, которая уже имеется в каком либо источнике, например в книгах, журналах, бухгалтерских данных, в отделе статистики, в отчетах, ранее проведенных исследованиях и тд.
Первичная – это информация, которая получается непосредственно для целей решения данной проблемы. Это различные опросы, интервью, наблюдения.
Вторичная информация собирается, как правило, в процессе кабинетных исследований без привлечения других. Место: рабочее место, библиотека.
Если приобретаются уже проведенные исследования – то делаем соответствующий запрос и оплату.
Думаю, что это понятно. Вторичная – это уже имеющаяся информация на каком либо носителе.
С этой информацией в основном и работают, считая что информация существует только в таком виде.
Но, получить более качественную информацию можно опросив эксперта по данному вопросу, или нескольких экспертов, чтобы сопоставить точки зрения.
Или провести опрос клиентов, чтобы получить информацию — что же они думают про Вашу компанию, продукт и обслуживание.
Или провести мозговой штурм, среди сотрудников, чтобы получить нетривиальное решение проблемы.
Все это относится к сбору первичной информации.
Руководитель может принимать решения – выслушав мнение одного –двух своих специалистов. В этом случае он также занимается сбором первичной информации.
Наблюдение за поведение человека, например в торговом зале – это также сбор первичной информации, на основе которой принимаются решения по размещению витрин, например.
Итак, первичная информация – это информация, которой еще нет на каком-либо носителе и нам приходится ее собирать общаясь с другими людьми.
Думаю, что так будет более-менее понятно в общих чертах.
Как собирать информацию?
Ответим на этот вопрос, т.е. определим какие методы сбора информации существуют.
Как я уже говорил в статье « Умение работы с информацией» – важно знать этапы и методы работы на каждом этапе.
Сейчас мы рассматриваем первый этап – поиск и сбор информации. И подошли к методам сбора информации.
Методы поиска информации:
1. Аудит своей знаниевой базы информации.
У вас уже имеется накопленная база данных в виде: файлов, книг, аудио и видео материалов. Первое что можно сделать – это поискать среди уже имеющейся у вас информации.
Как правило – если информация правильно систематизирована и кодифицирована, сделать это несложно. Достаточно задать Поиск по имени файла или другим способом, в соответствии с вашей кодификацией.
Если информация не систематизирована, то можно сделать поиск – по ключевым словам в тексте документа. Эти операции позволяет провести Microsoft Windows.
Таким образом указав нужные критерии запроса (ключевые слова) вы легко найдете подходящие папки и файлы внутри вашей базы.
Второй шаг – это поиск в вашей библиотеке — книг и журналов в печатном виде.
Расширение списка книги можно сделать следующим образом:
Начать с составления списка.
В своей книге «Как читать деловую литературу» я приводил основные источники получения информации для составления списка:
1. Рекомендации друзей и коллег.
2. Различные ссылки, содержащиеся в уже изученных ранее книгах.
3. Поиск списков литературы на специализированных форумах.
4. Различные подписки на специализированные рассылки.
5. Участие в различных электронных сообществах, посвященных Вашей тематике.
6. Посещение магазинов, в том числе поиск в Интернет-магазинах.
7. Обращения к специалистам с просьбой порекомендовать нужную литературу.
Это основные источники для получения списка важных книг по теме
2. Кабинетные исследования.
Получив информацию из существующей у вас базы Знаний, вы дополняете ее путем:
Работа с библиотечным фондом в центральных библиотеках, запросы в статистические и архивные службы.
Работа в поисковых системах.
Просмотр телепередач, видео и аудио–материалов.
На этом этап работы со вторичной информацией можно закончить и приступить при необходимости к сбору первичной информации.
3. Общение с экспертами по интересующей теме.
Часто эксперты дают «зацепки» по которым можно расширить область поиска информации. Узнать у эксперта – какие источники информации наиболее важные, какие книги почитать в первую очередь и тд.
Доступность экспертов в настоящее время облегает Интернет. Достаточно набрать на YouTube свой вопрос – и появится масса видеоматериалов, лекций, семинаров. Остается только выбрать действительно приличных экспертов.
Но лучше использовать живое общение, тем самым расширяя свои связи и улучшая навыки коммуникаций.
4. Непосредственное наблюдение.
Это один из методов сбора первичной информации. Например чтобы снять соц-дем портрет посетителей торговой точки – достаточно выделить один наиболее насыщенный потоком день и заполнить таблицу – группы по возрасту, полу и времени. Очень полезная информация для решений.
5. Опросы, анкетирование, тестирование.
Методик может быть множество: это и фокус-группы, мозговые штурмы, использование модели Исикавы и тд.
На этапе сбора информации лучше создать некоторую избыточность, чтобы затем отобрать важное и полезное.
На этом ограничусь, думаю, что для первого раза по этапу поиск информации достаточно.
Если есть вопросы, с удовольствием отвечу. Пишите, пожалуйста в комментариях.
Вот данные попали вам в руки — что с ними делать, с чего начать и чем закончить? Вот примерная схема:
1. Очистка данных
Структурируйте и очистите данные. Рассмотрите и приведите в порядок все переменные.
2. Имейте чёткую цель
Для чего вам нужны данные и какую пользу/информацию вы хотите извлечь и как это применять?
3. Саммари и описательная статистика
Проведите общий описательный анализ данных, найдите средние, дисперсии, отклонения, чтобы лучше понять данные.
4. Разведочный анализ
Постройте графики, определите возможные тренды, найдите корреляции, кластеры.
5. Сделайте выводы, постройте прогнозы
Пришло время строить прогнозные модели и делать соответствующие выводы.
6. Подготовьте отчёт
Подготовьте понятный и точный отчёт о найденных закономерностях и извлечённых знаниях.
Many times those starting with data science don’t know what to do with data once they have a dataset at hand. Where to start, which analysis to do, what to consider in the analysis and which tool to use are common questions not only posed by beginners.
First of all it is important to have a tidy dataset where each variable has its own column (if we deal with tabular data) and where each column has the same data type and its own name (meaning something about the values that it holds). There are great articles and tutorials about data tidying that will be referenced at the end of the article, since this is not our primary focus. In summary the data has to be well formatted and following a certain logic.
Once we have a clean dataset it is important to know what the data is about. We can have a medical dataset, but does it contain data about diseases, patient records, or pharmaceutical data about medicines? It is important to know a good deal about the data we have at hand. The more we know about the variables, the better.
After knowing the most we can about the data, we need to have a goal in mind. «What do I want to pull out of this dataset?» is a good question to ask ourselves. If we have a clear goal in mind, great! To predict one of its variables, to find some correlation between two variables or just summarize the data to make a report are examples of goals one can have in mind. If we don’t have a clear goal, it is a good idea to start with descriptive statistics taking the mean, mode, median, standard deviation and frequency of the data. It is a good idea to plot the variables we find most interesting to see if we can identify any visible trend. Just play around with data! Doing so becomes easier to formulate our «goal» for the analysis.
Maybe this is enough and we have already found what we were looking for. If reporting numbers of summarized data is the case, then we have already done a descriptive data analysis! But we can take a step further to «exploratory analysis» trying to squeeze some more juice out of the dataset.
An exploratory data analysis builds upon and complements a descriptive analysis. In this type of analysis we look for discoveries, patterns, trends, correlations among the variables. It is a good idea to plot some variables of interest, run a correlation function on some variables or classify the data into clusters. It is interesting to note that at this point we get a little more «acquainted» with the dataset and we can start to have some new insights. In a nutshell, this is what exploratory data analysis consists of.
With our findings we can make inferences or predictions using the data. We do inferential data analysis when we quantify whether our findings will likely hold beyond the dataset in hand. This is a very common statistical analysis in the formal scientific literature. An example can be the discoveries made back then about smoking being related to lung cancer. All started with some findings showing that people who used to smoke a lot also had lung cancer. Then researchers made inferences about it kick-starting a deeper study.
A predictive data analysis uses a subset of variables (independent variables) to predict another variable (the dependent variable). The most common techniques used in predictive analytics are linear regression and logistic regression. Some examples of this type of analysis are when organizations try to predict the total amount of phone calls their call center will receive in a given day, or when banks try to predict if a person will default. A more detailed example can be found in the book «Moneyball: The Art of Winning an Unfair Game» by Michael Lewis, where the author shows how predictive analytics helped a baseball team to win more games using, among other things, linear regression. This idea was such a success that changed many coaches approach to the sport.
So, basically the steps we need to take in order to start a sound data analysis are: first, to have a tidy dataset; second, to have a goal in mind (formulate what we want to extract from the data); third, do some descriptive analysis; fourth, do some exploratory analysis plotting variables to find correlations and trends and fifth, make inferences or predictions with the discoveries.
Regarding the tools to use, if we want to prepare the dataset getting variables from multiple tables or databases, SQL is very handy since the vast majority of relational databases uses it. After the dataset is ready descriptive analysis can be done in a spreadsheet software like MS Excel using the analysis tab. To do more advanced analysis we will need a more powerful tool like R, Python, Mathlab, SAS or WEKA. I prefer to use R or SAS even for descriptive analysis and use spreadsheet only for reporting. SAS is a great tool (the best in my humble opinion) but is not free. It actually has a limited free edition called SAS University Edition that is worth checking out to learn about the tool. R in the other hand is free and has many packages that make data analysis a lot easier. For most cases I think that R can answer any analyst´s demands. Python is a great programming language that has its popularity growing very fast among data scientists. With Python one can do data analysis and also do traditional programming (like a web page for instance). Mathlab is another powerful tool very popular in Machine Learning and complex math calculus. It has a free version called Octave. It is also a good idea to check it out. WEKA is a free software for data analysis developed in Java by the University of Waikato. It is part of the Pentaho Business Intelligence suite.
Like these there are so many tools, but these are the most widely used in the field. For the novice I think SQL, R or Python are the ones to go for. After knowing a good deal about them, one can move on to SAS, Mathlab, WEKA and so on.
Работа с данными
В процессе анализа неструктурированных данных мы проходим несколько шагов:
Рассмотрим подробнее каждые этапы.
Шаг 1. Формулировка вопроса помогает: определить какие данные нужны, придерживаться выбранного направления анализа, снизить риск отклонения от поставленной цели. Ошибка, допущенная на первом этапе, может привести к потере времени и «обнулить» результат работы всей команды.
Шаг 2. Подготовка данных практически всегда является сложным и трудоемким процессом, т.к. требует извлечения данных из исходных источников, их преобразования для работы и очистки от «грязных» данных. Мы извлекаем данные с web-сайтов, социальных сетей, из готовых баз данных, CSV-файлов, таблиц Excel. Подготовленные данные должны быть правильно отформатированы, учтены все отклонения (например, чрезмерно отклоняющиеся данные).
Для работы с данными мы используем инструмент Python, а именно, некоторые методы, которые могут применять в работе не только IT специалисты, но и аудиторы, делающие только первые шаги в программировании на этом языке.
Например, в наших выборках мы часто встречаем пропущенные значения. Пропуски могут возникать в результате объединения двух файлов с данными, в которых названия меток индексов и столбцов не совпадают, или значение переменной нам в данный момент неизвестно, или данные, полученные с внешних сайтов — неполные.
Для поиска пропусков в значениях (значения NaN в объекте DataFrame) мы используем библиотечный метод. isnull(). Значение «True» в наших данных после применения. isnull() означает, что в этой позиции элемент NaN.
Чтобы определить, что элемент не является пропущенным значением можно применить. notnull().
Чтобы вычислить количество NaN, мы используем метод. sum(), который принимает значение True =1, False=0.
Кроме того, можно воспользоваться методом. count(): для объекта Series метод возвращает число непропущенных значений. Для DataFrame считает количество непропущенных значений в каждом столбце.
Также для обработки пропущенных данных мы используем простое их удаление из нашей выборки. В библиотеке Pandas есть для этого несколько методов. Один из них — это фильтрация по условию с использование результатов ранее примененных. isnull() и. notnull(). Например, чтобы отобрать в столбце 3 нашей DataFrame (df) непропущенные значения используем код: df.c3[df.c3.notnull()], который извлечет все значения столбца 3, кроме NaN. Кроме того, мы используем метод. dropna(), который удаляет из объекта DataFrame строки, содержащие значения NaN. Для удаления только строк, в которых все значения неопределенны, используем параметр how = ‘all’: df.dropna(how=’all’). C помощью параметра how = ‘any’, удаляем столбцы, где есть хотя бы одно значение NaN. А с помощью параметра thresh задаем необходимый минимум заполненных значений, для того чтобы не удалять строки столбцы, в которых есть пропуски.
В некоторых случаях пропущенные значения мы заполняем определенным значением, используя метод. fillna(). Пропущенные значения можно заполнить константой, или последним непропущенным значением как в прямом:. fillna(method = «ffill”), так и обратном порядке:. fillna(method = ‘bfill»). Или заполняем с помощью индексов: fill_values. Кроме того, мы применяем метод интерполяции пропущенных значений. interpolate().
Шаг 3. Анализ подготовленных данных мы осуществляем с помощью методов классификации, кластеризации и обучения с подкреплением.
Каждый из этих инструментов мы используем в следующих случаях:
— метод классификации, если нами заранее определено в какие группы будем объединять данные (ответы «да»/«нет»);
— метод кластеризации, когда группы заранее неизвестны. Например, будем делать оценку возрастной категории клиента, давшего тот или иной ответ;
— метод обучения с подкреплением, когда не требуется выполнять точно заданные действия, но можно проводить исследования и обучаться лучшим методам решения задач.
Шаг 4. Переходя к визуализации данных, мы используем «две стороны одной монеты»: с одной стороны, мы визуализируем данные, чтобы изучить их, а с другой представить окружающим наши выводы и гипотезы. Визуальный анализ на этапе обработки данных помогает увидеть аномалии в данных, сделать обобщения результатов, выявить тенденции поведения групп данных и проверить отвечают ли наши данные на изначально заданный вопрос. Для этого мы используем пакет Seaborn для программ Python и ggplot2, и Shiny для R.
Визуализация данных для презентации результатов окружающим осуществляется с помощью программ PowerBI и Tableau. Данный этап также совмещает в себе подготовку выводов.
Подводя итог, хочется сказать, что часто методы работы с данными, освоенные ранее и которые нам нравятся, могут оказаться неэффективными. Привыкнув работать с Excel, не нужно бояться осваивать языки программирования Python или R. Ведь использование указанных выше программных продуктов помогают значительно ускорить процесс обработки данных.
Урок 6. Работа с информацией
Актуальность правильной работы с информацией сегодня неоспорима. Если прошлое столетие было эпохой промышленности, то в 21 веке наиболее ценным ресурсом без каких-либо сомнений является информация.
В наше время любая перспективная, престижная и высокооплачиваемая профессия связана с потоками данных, а развитие критического мышления и тренировка навыков работы с информацией крайне важны для достижения успеха на любом поприще.
Всякий человек, заинтересованный в достижении успеха в обучении, на работе и в жизни вообще, просто обязан научиться находить, собирать, анализировать, исследовать и хранить информацию, а также делать на ее основе правильные выводы.
Содержание:
Информация огромнейшими объемами обрушивается на нас буквально ежедневно. И если мы не будем в состоянии распределять данные, определять, какие из них полезны и ценны, а какие можно отбросить за ненужностью, мы рискуем в них завязнуть и утонуть.
Информационное поле – это та среда, в которой сейчас мы находимся постоянно, однако далеко не все, что мы узнаем, видим и слышим, может быть для нас важным и имеющим значение. Данные нужно оценивать критически, проверяя на актуальность, достоверность, правдивость.
Чересчур большие объемы поступающих сведений становятся причиной поверхностного восприятия, а это в свою очередь приводит к клиповому мышлению, являющемуся, кстати говоря, одной из характеристик поколения современности.
Клиповое мышление представляет собой такое явление, когда человек улавливает и усваивает лишь небольшие и поверхностные отрывки информации. В итоге память засоряется огромным количеством самых разных, но, по сути, совершенно бесполезных сведений.
Чтобы избежать этой коварной ловушки, нужно также научиться правильно взаимодействовать с данными, а это требует не только умения отсеивать нужное и ненужное, но и освоения различных методов работы с информацией.
Обо всем, что мы только что перечислили, мы с вами и поговорим ниже. После прохождения урока ваши знания о развитии и применении критического мышления станут намного обширнее, что, несомненно, пригодится на практике в каждодневной жизни.
Для чего нужна информация
Цели применения информации могут быть стратегическими, тактическими и оперативными. Это обуславливает ее целевое назначение.
Стратегическая информация
Стратегическая информация применяется при долгосрочном планировании и решении задач глобального масштаба, а также в бизнесе, к примеру, в поиске путей развития компаний и организаций. Даже в тех случаях, когда при первом ознакомлении с этим типом данных они никак не связаны с деятельностью напрямую, они могут играть решающую роль судьбе человека или организации, инициировавшей поиск.
Структура базы стратегической информации применительно, например, к бизнесу, может выглядеть следующим образом:
Говоря проще, стратегическая информация позволяет найти ориентиры на пути постановки целей и в общих чертах указать направление движения.
Тактическая информация
Если стратегическая информация служит для определения направления развития, то тактическая будет отвечать на вопрос, каким именно образом будут достигаться цели и решаться задачи. Она способствует повышению эффективности планирования, помогает определять препятствия на пути, расширять масштабы деятельности, внедрять инновации, применять новые технологии и т.п.
Если вернуться к нашему примеру с бизнесом, то структура базы тактической информации будет выглядеть так:
Продукт (исследование предложений конкурентов, снятие с производства устаревшей продукции, вывод на рынок новых разработок, изучение соответствия нового продукта правовым нормам государства).
Тактическая информация носит более практический характер и позволяет разработать комплекс конкретных мероприятий или подробный план действий по решению наиболее приоритетных задач.
Оперативная информация
Оперативная информация состоит из сведений, которые могут помочь разрешить текущие и срочные вопросы. В бизнесе это может быть срочный поиск нового поставщика или заказчика, урегулирование форс-мажорных обстоятельств, устранение угроз, способных привести к исчезновению компании. В работе это могут быть изменения в структуре организации, повышение должности, объединение нескольких отделов. В обычной жизни это может быть поиск той самой работы при внезапном сокращении, выбор специальности при поступлении в институт и т.д. Оперативная информация необходима для разрешения любых подобных ситуаций.
Базы оперативной информации включают все, что может быть быстро применимо в сложных условиях. Точность и достоверность фактов играет здесь ключевую роль, т.к. вопросы, на разрешение которых они влияют, могут иметь судьбоносное значение для всей деятельности человека, группы людей или организации.
Несмотря на то, что мы привели в качестве основного примера бизнес, не стоит полагать, что стратегические, тактические и оперативные цели применения информации касаются только этой сферы. С подобным успехом аналогичные цели можно ставить при планировании обучения, разработке пошагового руководства по выходу из сложной финансовой ситуации, разрешении срочных проблем в любой сфере жизни. Главное в этом вопросе – определить, какая информация будет стратегической, какая – тактической, а какая – оперативной.
Таким образом, понять, в чем суть применения информации, достаточно просто: она служит для пополнения своего багажа знаний (базы данных) новыми сведениями, которые могут теоретически или практически пригодиться в жизни. Но мы с вами ведем речь о развитии критического мышления, а это значит, что информацию нужно научиться правильно искать, и этот вопрос имеет в контексте нашей беседы основополагающее значение.
Теоретические основы поиска информации
Одна из особенностей информации в эпоху современности состоит в том, что намного чаще она сама находит человека, даже если он ее не ищет. Но знать основы информационного поиска все же нужно.
В первую очередь следует вспомнить, что информация может различаться по способу восприятия (визуальная, аудиальная, обонятельная, тактильная и вкусовая), по форме представления (графическая, звуковая, текстовая и числовая) и по назначению (массовая, личная и специальная).
Такое различие обуславливает и многообразие источников информации. Среди основных источников можно выделить:
✔ | Средства массовой информации (радио, телевидение, газеты). |
✔ | Интернет. |
✔ | Узкопрофильные источники (научные трактаты, фундаментальные труды, методические пособия, учебники и другая специализированная литература). |
✔ | Живые источники (друзья, коллеги, специалисты и другие люди, которые могут предоставить какие-то сведения). |
Чтобы поиск информации проходил наиболее продуктивно, рекомендуется использовать в работе сразу несколько источников информации, и желательно, чтобы они были разных типов. Но основное значение имеет все же их достоверность. К примеру, самыми объективными и правдивыми считаются данные из научной литературы, энциклопедий и словарей. Если же с какими-то материалами вы сталкиваетесь впервые, нужно проводить анализ источников информации.
Получить дополнительные знания о поиске информации и выборе источников вы можете, перейдя по этой ссылке. Мы же, учитывая наличие на нашем сайте соответствующего материала, рассчитываем на ваш серьезный подход к делу, и, дабы не тратить времени, перейдем к следующему вопросу.
Практические основы поиска информации
Информация, если найти ее определение в энциклопедии или Википедии, представляет собой сведения по какому-либо вопросу. О том, зачем человеку могут потребоваться сведения, говорить, наверное, не нужно – это просто жизненная необходимость. Располагая нужной информацией, мы получаем возможность принимать решения, делать выводы, давать оценку происходящему и реагировать на него. Но сам факт того, что у нас есть информация, еще вовсе не означает, что все это мы сможем сделать правильно, критически и объективно.
Информация обладает рядом качественных характеристик:
Подходя к работе с данными безграмотно, мы рискуем не только никуда не продвинуться на своем пути и не узнать ничего дельного, но и составить неверные выводы, совершить неправильные поступки и ошибиться. Поэтому работа с информацией предполагает серьезный и критический подход.
Правильный подход к работе с информацией означает, что:
1 | Нужно составить приблизительный список источников, где может находиться искомая информация (книги, учебники, интернет-сайты, карты, фотографии, аудиозаписи, видеоматериалы, статистика и т.д.) |
2 | Нужно грамотно и грамматически верно сформулировать запрос (очень важно четко понимать, что конкретно вы хотите найти). |
3 | Нужно использовать уже имеющуюся информацию, которая может помочь в поиске недостающей (например, при поиске данных в периодике может помочь знание дат выпуска изданий, при поиске стихотворения в интернете может помочь даже пара слов из какой-то строчки и т.д.) |
Как только вы обозначите область поиска, можно приступать к практическим действиям. Основой этих действий служат методы работы с информацией:
Рассмотрим методы работы с информацией подробнее.
Мозговой штурм
Первым этапом здесь станет своеобразный мозговой штурм: вы просто находите информацию по теме, никак ее не анализируя, не сортируя и не отбирая. Ваша задача – собрать материал для работы, т.е. любые сведения на исследуемую тему.
Фильтрация
Следует понимать, что случаи, когда полезным оказывается весь объем найденных данных, – большая редкость. Практически всегда люди ищут ответы на конкретные вопросы или раскрывают узкую тему. Получается, что на втором этапе вы должны отобрать полезные вам сведения. Лучше всего сразу бегло ознакомиться с источником и отбросить все, что не касается актуальной для вас темы. Далее следует третий этап.
Анализ
Как только вы отсеете все ненужное, вам останется проанализировать нужное и определить его объективность и достоверность (не забывайте учитывать и достоверность источников). Критически оценить информацию можно только через факты и логику – ни о каких ощущениях и «здравом смысле» не может быть и речи. Подтвердить же факты и свидетельства вы сможете лишь с помощью собственного исследования.
Исследование проводится с учетом следующих правил:
✔ | Проверять все, что только можно проверить, и не доверять ничему, что не подкреплено фактами, установленными эмпирическим путем. |
✔ | Принимать во внимание любые источники информации, где есть хотя бы некоторые сведения по интересующему вопросу. |
✔ | Если один источник ссылается на другие, в обязательном порядке проверять их. |
✔ | Всегда искать более одного взгляда на проблему, в особенности, когда она касается каких-то предположений, гипотез и теорий. |
✔ | Учитывать любую информацию, не опровергнутую доподлинно (при этом, если достоверность не подтверждена полностью, эта информация становится второстепенной). |
После всех описанных манипуляций с источниками в распоряжении появляется определенный массив информации, где содержатся самые разнородные сведения. Из них уже можно составить общую картину происходящего, но делать окончательный вывод еще рано. До этого нужно еще раз проанализировать все новые данные.
Повторный анализ
Делая окончательный анализ, нужно вернуться к основной теме и целям поиска, чтобы посмотреть на полученные сведения именно под этим углом. Очень важно получить ответы на основные вопросы:
Если на какой-то из вопросов ответить однозначно не получается, сбор данных следует осуществить повторно. Может получиться так, что вы сделаете выводы, совершенно противоположные тем, к которым вы склонялись в начале, или найдете новый смысловой слой по выбранное проблеме, способный изменить или углубить ваше понимание.
Еще немного об анализе информации
Самое главное в процессе анализа данных и, пожалуй, первое, что вы должны сделать – это определиться с тем, что для вас будет действительно полезной информацией, а что окажется лишь информационным шумом. В этом вам помогут ответы на такие вопросы:
Как видите – критическое мышление во всей красе. И если по какой-то причине ответить на эти вопросы вы не можете, значит, сведения, с которыми вы столкнулись, вам не нужны. Полезная информация всегда связана с действиями. Поэтому данные, которые нельзя нигде применить, можно считать бесполезными.
Кроме того, при анализе информации нужно учитывать два базовых критерия оценки – это правдивость и надежность сведений. Определить их можно, изучив первоисточник, а также сравнив его с другими первоисточниками. Получаемые вами данные должны соответствовать особенностям эпохи и быть актуальными, иначе их можно смело отбросить как устаревшие.
О других принципах отбора информации вы также можете узнать из статьи, указанной нами выше, в одноименном разделе. Помните, что анализ данных – это краеугольный камень всего информационного поиска, и если они соответствуют заявленным требованиям, их можно смело брать в оборот.
Когда нужная информация будет найдена, настанет время переходить к следующей стадии – обработке, заключающейся в составлении выводов и грамотной формулировке.
Выводы и формулировка
Выводы проистекают из анализа. Анализ, конечно, отвечает на поставленные в начале поиска вопросы, но выводы являются сферой деятельности личного ума и творческой составляющей. Основываясь на проанализированной информации, следует сделать умозаключения. Нередко это позволяет даже выдвинуть собственные гипотезы и версии.
Теперь нужно придать своим мыслям удобоваримую форму, выстроив их в текст. Можно делать это письменно, а можно мысленно и устно. Последнее, кстати, прекрасно упорядочивает мышление, делая его более стройным и лаконичным, и способствует более глубокому пониманию новой информации.
На этом поиск и обработка информации заканчиваются, и вы можете использовать ее для решения актуального для вас вопроса. В бизнесе этот навык позволяет «прощупать почву» на новом рынке, в работе помогает реализовывать проекты, в обучении служит прекрасным инструментом для написания курсовых и научных работ, дипломов и диссертаций, в обычной жизни способствует разрешению конфликтов и выходу их сложных ситуаций.
Это лишь несколько примеров, показывающих всю широту области применения навыка критической обработки информации. Применена же информация может быть как единовременно, так и многократно. Информация, нужная нам сейчас лишь постольку-поскольку, чаще всего через какое-то время отбрасывается за ненадобностью. Но важные сведения, имеющие для человека большое значение, сохраняются, чтобы к ним был обеспечен постоянный доступ. Поэтому необходимо уметь правильно хранить их.
Хранение информации
Невзирая на то, что сегодня всеобщее распространение получил интернет, а информацию все чаще хранят на портативных высокотехнологичных носителях (флешках, внешних жестких дисках и других хранилищах) и в виртуальном пространстве (Google.Docs, Яндекс.Диск, Облако@mail и т.п.), многие учреждения (государственные, коммерческие, юридические) и специалисты предпочитают хранить важные сведения в форме бумажных документов. Исходя из этого, нижеизложенные советы будут применимы как к электронным, так и к бумажным носителям.
Наиболее удобным способом работы с данными станет размещение документации так, чтобы был обеспечен быстрый и беспрепятственный доступ к ним. Для этого рекомендуется создать три рабочих области, и каждая из них будет соответствовать частоте ваших запросов – тому, насколько часто вы к ней обращаетесь.
Первая область
К первой области нужно отнести те сведения, которые требуются вам каждый день, и которые могут пригодиться в любой момент. Независимо от того, в бумажной или электронной форме они представлены, находиться они должны на вашем рабочем столе (рабочем столе компьютера).
ВАЖНЫЙ СОВЕТ: Касаемо конкретно ПК, не следует хранить файлы важных данных на самом рабочем столе, т.к. все, что на нем находится, относится к операционной системе, а она, как правило, устанавливается на системный диск C. Если вдруг «винда слетела» или на компьютере произошел какой-то сбой, систему придется переустанавливать, а это значит, что все данные с диска C будут стерты. Чтобы предостеречь себя от потери важных документов, нужно либо создавать резервные копии и переносить их на диск D или съемный носитель, либо просто хранить на диске D, а на рабочем столе создавать ярлыки. Здесь же заметим, что не стоит хранить данные на обычных компакт-дисках, т.к., во-первых, они уже почти неактуальны, а во-вторых, при многократном использовании и долговременном хранении они перестают читаться устройствами воспроизведения и становятся совершенно непригодными к использованию.
Вторая область
Ко второй области относится информация, необходимая время от времени, но не каждый день. Например, в рабочем кабинете или просто дома для хранения таких данных могут подойти ящики рабочего стола или специальные полочки для папок и бумаг. Если речь об электронных документах, то они могут храниться на диске D или на съемном накопителе.
Третья область
И третья область – это архивная зона. В ней хранятся сведения, использовавшиеся вами ранее и способные пригодиться в перспективе. Иногда нужно что-то перепроверить или освежить в памяти, и документы в архиве хранятся как раз для этого. На компьютере этим документам соответствует раздел «Архив», а в рабочем кабинете или дома – отдельные полки, стеллажи, ящики, коробки.
Кстати, говоря об электронных носителях, важно заметить, что сохранять свои файлы и документы нужно в распространенных расширениях (например, документ MS Word лучше сохранить с расширением «doc», а не «docx»), чтобы при необходимости они могли быть открыты любыми версиями и аналогами программ.
ВАЖНЫЙ СОВЕТ: Не будет лишним заметить, что для хранения информации второго (время от времени) и третьего (архив) порядка сейчас очень удобно использовать облачные сервисы, о которых мы упоминали в начале этого раздела. При желании можно обратиться и к платным сервисам хранения данных, где сведения будут защищены более надежно: Microsoft OneDrive, Dropbox, Amazon Web Services, iCloud Drive (плата на этих сервисах взимается, если вы планируете хранить более 5-10 Гб данных). Ощутимое преимущества такого способа хранения состоит в том, что получить доступ к данным вы можете из любой точки мира, где имеется доступ в Сеть. Однако слепо доверять этим сервисам опять же не стоит, ведь в случае серьезного сбоя в работе или мощной хакерской атаки информация может быть безвозвратно утеряна или доступна третьим лицам. Помните, что осторожность всегда полезна, а золотым правилом хранения данных является наличие одного оригинала и двух копий на разных носителя и в разных местах.
Корзина
Не менее важно, помимо прочего, и то, что работа с информацией включает в себя не только ее сбор, обработку и хранение, но также и утилизацию. Поэтому есть еще и четвертая область (она может быть как реальной, так и виртуальной) – это корзина (мусорное ведро). Если данные устаревают и становятся неактуальными, если вы уверены в том, что вам больше не придется к ним обращаться, без всяких сожалений выбрасывайте их. Во-первых, вы освободите львиную долю места, а во вторых избавите себя от перспективы тратить время на разбор завалов, состоящих из кип бумаг или десятков и сотен самых разношерстных файлов. На этом разговор о работе с информацией можно считать законченным.
Заключение
Грамотная работа с информацией является одним из важных элементов критического мышления. Научившись правильному поиску, фильтрации, анализу, обработке и хранению данных вы существенно облегчите себе жизнь. Отныне вы не будете тратить бесконечные часы на блуждание в информационных потемках, а все собранные вами данные будут иметь исключительную практическую пользу для вас.
Хотите проверить свои знания?
Если вы хотите проверить свои теоретические знания по теме курса и понять, насколько он вам подходит, можете пройти наш тест. В каждом вопросе правильным может быть только один вариант. После выбора вами одного из вариантов система автоматически переходит к следующему вопросу.
Напоминаем, что для полноценной работы сайта вам необходимо включить cookies, javascript и iframe. Если вы ввидите это сообщение в течение долгого времени, значит настройки вашего браузера не позволяют нашему порталу полноценно работать.
Итак, наш курс по развитию критического мышления подошел к концу. Теперь в вашем распоряжении все необходимые знания. Мы желаем вам успехов на пути освоения навыка мыслить критически, и уверены, что успех не заставит себя долго ждать.