Как открыть в Excel файл CSV с разделителем запятая? Формат данных CSV. Изучение и написание обзора формата CSV Расширение csv

Чтобы узнать чем открыть файл CSV формата, следует перейти к списку установленных программ на вашем компьютере. Если там есть MS Excel, почтовый клиент Microsoft Outlook или любой текстовый редактор – загружайте документ в него. Так как офисный пакет Microsoft установлен практически на каждом ПК – софт из него мы назвали в первую очередь. Вы же можете опробовать и другие приложения:

  • Microsoft Works
  • Notepad
  • Corel Quattro Pro
  • IBM Lotus Symphony
  • KSpread
  • LabVIEW

Как открыть файл CSV в Excel

Для того чтобы программа для создания таблиц правильно расшифровала этот документ, следует выполнить одну хитрость: открыть файл в любом текстовом редакторе и написать в первой строке «sep=». Все, теперь приложение опознает разделитель в виде запятой и корректно отобразит содержимое!

Что находится в файле CSV

Это обычный текстовый формат для табличных данных. Каждая строчка – это одна строка в таблице. Значения в отдельных колонках разделяются запятой. Так как это расширение поддерживается многими программами, CSV-файлы можно использовать для импорта или экспорта табличных данных между различными компьютерными приложениями, например электронной таблицей и базой данных.

Формат CSV (от англ. Comma-Separated Values) – это формат обычного текстового файла, в котором прописывается поток текстовых данных, разделенных точкой с запятой. Предназначением данной технологии является представление табличных данных. При этом формат является универсальным. С помощью csv-файлов возможно представить таблицы любых баз данных, так как синтаксис этого формата максимально прост и будет понятен практически любому с ним столкнувшемуся человеку. Все записи таблиц из базы данных, при преобразовании в csv-формат, преобразуются в строки. Ячейки таблицы в этих строках выделяются запятыми или точкой с запятой – специальными символами формата csv. К примеру, запись вида (исключая кавычки):
“название; страна; язык;
Москва; Россия; Русский;
Берлин; Германия; Немецкий;
Токио; Япония; Японский;”

будет выглядеть как таблица, если ее открыть в Microsoft Excel или OpenOffice.org Calc. И в этой таблице будет три колонки из названия страны, ее столицы и государственного языка. Сам формат CSV так же состоит из трех своих ответвлений-стандартов, о применении каждого из которых говорят по специальному символу, разделяющему текстовые данные. Так, если используется точка с запятой, как в примере выше, то это SCSV, если просто запятая – CSV и табуляция для TSV. Хотя часто на практике все файлы трех форматов обобщают в CSV.

Данная технология преобразования таблиц широко применяется на практике, даже при наличии многих других инструментов, например, xml-формата. CSV нашел свое применение, как у web-разработчиков, так и у разработчиков мобильных технологий. Применяется он для импортаэкспорта таблиц изв различные системы управления БД.

Недостатки CSV

Универсальность и простота данной технологии имеет свои недостатки. К примеру, основным из них является не единый во всех системах специальный символ. То есть, при импорте или экспорте одни системы, работающие с таблицами, могут не воспринять точку с запятой и воспринять просто запятую. Поэтому надо знать, какое ПО – какой специальный символ распознает.

Другим недостатком CSV является то, что в коде csv-файла нельзя использовать текст в ячейке, разделенный на несколько строк. При преобразовании его, к примеру, в xls-формат, эта ячейка разделится на две строки.

P.S. Если у вас уже есть свой сайт и вам не нужно никуда переносить свою базу данных, значит формат csv в ближайшее время вам не пригодится. Но, конечно знания о нем будут не лишними. Так же, как и знания о том, как заработать на собственном сайте. Например о том, как монетизировать сайт с помощью партнерок вы сможете узнать на сайте Partnerskie-Programmy.org.

CSV (Comma-Separated Values) представляет собой файл текстового формата, который предназначен для отображения табличных данных. При этом колонки разделяются запятой и точкой с запятой. Узнаем, с помощью каких приложений можно открыть данный формат.

Как правило, для корректного просмотра содержимого CSV используются табличные процессоры, а для их редактирования можно применять и текстовые редакторы. Давайте подробнее рассмотрим алгоритм действий при открытии различными программами данного типа файлов.

Способ 1: Microsoft Excel

Рассмотрим, как запустить CSV в популярном текстовом процессоре Эксель , который входит в пакет Microsoft Office.


Существует ещё один метод перехода в «Мастер текстов» .

  1. Переместитесь в раздел «Данные» . Нажимайте на объект «Из текста» , размещенный в блоке «Получение внешних данных» .
  2. Появляется инструмент «Импорт текстового файла» . Так же, как и в окошке «Открытие документа» , тут требуется перейти в область расположения объекта и отметить его. Выбирать форматы не нужно, так как при использовании этого инструмента объекты, содержащие текст, будут отображаться. Кликайте «Импорт» .
  3. Запускается «Мастер текстов» . В первом его окошке «Укажите формат данных» ставьте радиокнопку в положение «С разделителями» . В области «Формат файла» должен стоять параметр «Юникод (UTF-8)» . Нажимайте «Далее» .
  4. Теперь необходимо выполнить очень важный шаг, от которого будет зависеть корректность отображения данных. Требуется указать, что именно считается разделителем: точка с запятой (;) или запятая (,). Дело в том, что в разных странах в этом плане применяются различные стандарты. Так, для англоязычных текстов чаще применяется запятая, а для русскоязычных – точка с запятой. Но бывают и исключения, когда разделители применяются наоборот. Кроме того, в очень редких случаях в качестве разделителей используются другие знаки, например волнистая линия (~).

    Поэтому пользователь сам должен установить, служит ли в данном случае конкретный символ разделителем или является обычным знаком пунктуации. Это он может сделать, взглянув на текст, который отображается в области «Образец разбора данных» и основываясь на логике.

    После определения пользователем того, какой именно знак является разделителем, в группе «Символом-разделителем является» следует установить флажок около пункта «Точка с запятой» или «Запятая» . Со всех остальных пунктов флажки следует убрать. Затем нажимайте «Далее» .

  5. После этого открывается окно, в котором, выделив конкретный столбец в области «Образец разбора данных» , можно назначить ему формат для корректности отображения информации в блоке «Формат данных столбца» путем переключения радиокнопки между следующими положениями:
    • пропустить столбец;
    • текстовый;
    • дата;
    • общий.

    После выполнения манипуляций нажимайте «Готово» .

  6. Появляется окошко, в котором спрашивается, где именно расположить на листе импортируемые данные. Путем переключения радиокнопки это можете сделать на новом или уже имеющемся листе. В последнем случае также можно задать точные координаты расположения в соответствующем поле. Чтобы не вписывать их вручную, достаточно поставить курсор в это поле, а затем выделить на листе ту ячейку, которая станет левым верхним элементом массива, где будут добавлены данные. После установки координат жмите «OK» .
  7. Содержимое объекта отобразится на листе Эксель.

Способ 2: LibreOffice Calc

Запускать CSV умеет и другой табличный процессор – Calc, входящий в сборку LibreOffice .

  1. Запустите LibreOffice. Щелкайте «Открыть файл» или воспользуйтесь Ctrl+O .

    Также можете произвести переход через меню, нажав «Файл» и «Открыть…» .

    Кроме того, в окно открытия можно попасть и непосредственно через интерфейс Calс. Для этого, находясь в LibreOffice Calc, щелкайте по значку в виде папки или наберите Ctrl+O .

    Ещё один вариант предусматривает последовательный переход по пунктам «Файл» и «Открыть…» .

  2. Использование любого из множества перечисленных вариантов приведет к появлению окна «Открыть» . Переместитесь в нем в место нахождения CSV, отметьте его и жмите «Открыть» .

    Но можно даже обойтись без запуска окна «Открыть» . Для этого следует перетянуть CSV из «Проводника» в ЛибреОфис.

  3. Появляется инструмент «Импорт текста» , являющийся аналогом «Мастера текстов» в Экселе. Преимущество состоит в том, что в этом случае не придется перемещаться между различными окнами, выполняя настройки импорта, так как все необходимые параметры расположены в одном окошке.

    Сразу перейдите к группе настроек «Импорт» . В области «Кодировка» выбирайте значение «Юникод (UTF-8)» , если там отображается иное. В области «Язык» выберите язык текста. В области «Со строки» нужно указать, с какой именно строчки следует начинать импорт содержимого. В большинстве случаев в этот параметр изменение вносить не нужно.

    Далее переходим к группе «Параметры разделителя» . Прежде всего, необходимо установить радиокнопку в позицию «Разделитель» . Далее по такому же принципу, который был рассмотрен при использовании Эксель, нужно указать, установив флажок напротив определенного пункта, что именно будет играть роль разделителя: точка с запятой или запятая.

    «Другие параметры» оставляем без изменений.

    Предварительно увидеть, как именно выглядит импортируемая информация при изменении тех или иных настроек, можно в нижней части окна. После введения всех необходимых параметров нажимайте «OK» .

  4. Содержимое отобразится через интерфейс ЛибреОфис Кальк.

Способ 3: OpenOffice Calc

Просмотреть CSV можете с помощью ещё одного табличного процессора — OpenOffice Calc .

  1. Запустите ОупенОфис. В главном окне нажимайте «Открыть…» или используйте Ctrl+O .

    Также можете использовать меню. Для этого перейдите по пунктам «Файл» и «Открыть…» .

    Как и при использовании метода с предыдущей программой, добраться до окна открытия объекта можно прямо через интерфейс Кальк. В этом случае нужно нажать на иконку в образе папки или применить все то же Ctrl+O .

    Также можете использовать меню, перейдя в нем по позициям «Файл» и «Открыть…» .

  2. В появившемся окне открытия перейдите в область размещения CSV, выделите этот объект и жмите «Открыть» .

    Можно обойтись и без запуска этого окна, просто перетянув CSV из «Проводника» в ОупенОфис.

  3. Любое из множества описанных действий приведет к активации окошка «Импорт текста» , которое очень похоже и по внешнему виду, и по функционалу на инструмент с аналогичным наименованием в LibreOffice. Соответственно и действия производите точно такие же. В полях «Кодировка» и «Язык» выставляйте «Юникод (UTF-8)» и язык текущего документа соответственно.

    В блоке «Параметра разделителя» ставьте радиокнопку около пункта «Разделитель» , после чего отметьте флажком тот пункт («Точка с запятой» или «Запятая» ), который соответствует типу разделителя в документе.

    После выполнения указанных действий, если данные в отображаемой в нижней части окна форме для предварительного просмотра отображаются корректно, нажимайте «OK» .

  4. Данные будут успешно отображены через интерфейс ОупенОфис Кальк.

Способ 4: Блокнот

Для редактирования можно применять обычный Блокнот.


Способ 5: Notepad++

Открывать можно и с помощью более продвинутого текстового редактора — Notepad++ .


Способ 6: Safari

Просмотреть содержимое в текстовом варианте без возможности его редактирования можно в браузере Safari . Большинство других популярных браузеров такую возможность не предоставляют.


Способ 7: Microsoft Outlook

Некоторые объекты CSV представляют собой экспортированные из почтового клиента электронные письма. Их можно просматривать с помощью программы Microsoft Outlook , произведя процедуру импортирования.

  1. Запустите Аутлук. После открытия программы перейдите во вкладку «Файл» . Затем щелкните «Открыть» в боковом меню. Далее жмите «Импорт» .
  2. Запускается «Мастер импорта и экспорта» . В представленном перечне выбирайте «Импорт из другой программы или файла» . Нажимайте «Далее» .
  3. В следующем окне следует выбрать тип объекта для импорта. Если мы собираемся импортировать CSV, то необходимо выбрать позицию «Значения, разделенные запятыми (Windows)» . Жмите «Далее» .
  4. В следующем окошке жмите «Обзор…» .
  5. Появляется окно «Обзор» . В нем следует перейти в то место, где находится письмо в формате CSV. Обозначьте этот элемент и нажимайте «OK» .
  6. Происходит возврат в окошко «Мастера импорта и экспорта» . Как можете заметить, в области «Файл для импорта» был добавлен адрес на место расположения объекта CSV. В блоке «Параметры» настройки можно оставить по умолчанию. Жмите «Далее» .
  7. Затем нужно отметить ту папку в почтовом ящике, в которую вы хотите поместить импортируемую корреспонденцию.
  8. В следующем окне отобразится наименование действия, которое будет выполнено программой. Тут достаточно нажать «Готово» .
  9. После этого, чтобы просмотреть импортированные данные переместитесь во вкладку «Отправка и получение» . В боковой области интерфейса программы выделите ту папку, куда было импортировано письмо. Затем в центральной части программы появится список писем, находящихся в данной папке. Достаточно щелкнуть по нужному письму дважды левой кнопкой мыши.
  10. Импортированное из объекта CSV письмо будет открыто в программе Аутлук.

Стоит, правда, заметить, что данным способом можно запустить далеко не все объекты формата CSV, а только письма, структура которых отвечает определенному стандарту, а именно содержащие поля: тема, текст, адрес отправителя, адрес получателя и др.

Как видим, существует довольно много программ для открытия объектов формата CSV. Как правило, лучше всего просматривать содержимое таких файлов в табличных процессорах. Редактирование можно выполнять в виде текста в текстовых редакторах. Кроме того, существуют отдельные CSV с определенной структурой, с которыми работают специализированные программы, например почтовые клиенты.

Формат CSV ― это текстовый формат, предназначенный для представления табличных данных. Первая строка содержит названия столбцов, а следующие строки ― сами данные. Содержимое столбцов отделяется друг от друга запятой.

Данные в файле должны быть в кодировке UTF-8.

Примечание.

Данные в примере представлены в кодировке UTF-8.

Для просмотра примера в LibreOffice необходимо сделать импорт текста. При этом выберите кодировку UTF-8, разделитель ― «запятая» , разделитель текста ― « \"(двойные кавычки)» .

Для просмотра примера в Excel сохраненный файл откройте через меню Данные → Получение внешних данных → Из текста . Выберите кодировку UTF-8, разделитель «запятая» , ограничитель строк «\"(двойные кавычки)» .

Описание элементов

Элемент Описание

Обязательный элемент.

Обязательный элемент.

Обязательный элемент.

Дополнение к адресу.

Обязательный элемент.

Обязательный элемент.

Обязательный элемент.

Обязательный элемент.

lon
Элемент Описание

Название филиала. Указывается без кавычек, с учетом регистра.

Обязательный элемент.

Страна. Указывается полностью, без сокращений.

Обязательный элемент.

Полный адрес местонахождения филиала, с точностью до дома.

Обязательный элемент.

Дополнение к адресу.

Номер телефона с кодом страны и населенного пункта. Если номеров несколько, они отделяются друг от друга точкой с запятой (;).

Обязательный элемент.

Примечание. У каждого филиала может быть до трех рубрик, но хотя бы одна из них должна совпадать с рубрикой сети.

Обязательный элемент.

Основной сайт сети. Указывается в нижнем регистре, полностью, включая http:// или https://.

Обязательный элемент.

Часы работы. Выходные, нерабочие дни не указываются.

Обязательный элемент.

Координата по широте. В качестве разделителя целой и дробной части используется точка.

lon

Координата по долготе. В качестве разделителя целой и дробной части используется точка.

Подготовка файла

Чтобы настроить автоматическое ежедневное обновление данных о ваших филиалах:

    Подготовьте файл в формате CSV. Данные должны быть в кодировке UTF-8.

    Выложите файл на свой сайт по обновляемой ссылке.

    Данные должны быть доступны по протоколу HTTP или HTTPS.

Загрузка файла в интерфейсе

На странице сети перейдите в раздел Филиалы . В блоке Управление филиалами выберите Файл .

Если проверка файла прошла успешно, нажмите кнопку Результаты проверки . В открывшемся окне проверьте изменения в филиалах. На карте может быть показано до 50 филиалов с изменениями. Нажмите Все верно, начать загрузку в базу . Данные из файла пройдут модерацию и будут загружены в базу Справочника. При большом объеме данных загрузка может занять несколько суток.формы . Укажите в сообщении актуальный электронный адрес и телефон вашей организации. Если у нас возникнут вопросы по загруженному файлу, мы свяжемся с вами.

Новые данные появятся на Яндекс.Картах в течение семи дней после загрузки правильно оформленного файла.

Министерство образования и науки Российской Федерации

Государственное бюджетное учреждение высшего профессионального образования

Новосибирский государственный технический университет

Кафедра СИТ

Расчетно-графическая работа

по дисциплине

«Сетевые информационные технологии»

Формат данных CSV

Группа: АВТ-909

Выполнил: Гоголи А.Г.

Преподаватель:

Хайретдинов М.С.

Новосибирск, 2013

Задание. 3

1. Введение. 4

2. Общие сведения. 5

3. Структура данных в файле. 6

3.1. Записи. 6

3.2. Поля (столбцы) 6

3.2 Разделители. 7

3.3 Маркер конца записи. 7

4. Запись заголовка. 9

5. Защита поля данных. 9

5.1 Двойные кавычки для защиты.. 9

5.2 Двухместный двойные кавычки. 10

6. Пример реализации. 11

7. Библиотеки для работы с форматом.. 12

8. Тестовая программа. 13

Литература. 14


Задание

1. Изучить и написать обзор формата CSV.

2. Написать обзор имеющихся в сети бесплатно распространяемых библиотек, реализующих чтение/запись данных в указанном формате/языке описания или пересылку данных для указанного протокола или интерфейса I/O и стыкуемых с модулями на С/С++.

3. Написать процедуру чтения данных в указанном формате.

4. Написать процедуру записи данных в указанном формате.

5. Написать функцию приема/передачи данных с использованием указанного протокола или интерфейса I/O.

6. Составить тестовые наборы данных для проверки всех видов элементов данных, используемых в указанном формате.


1. Введение

CSV (от англ. Comma-Separated Values - значения, разделённые запятыми) - текстовый формат, предназначенный для представления табличных данных. Каждая строка файла - это одна строка таблицы. Значения отдельных колонок разделяются разделительным символом (delimiter) -запятой(,).

CSV-файл можно рассматривать как хранилище данных от приложения производителя до считывания приложением потребителя. Их основная функция заключается в хранении текстовых данных и не предназначены для двоичных данных.


2. Общие сведения

CSV файл состоит из двух типов данных: полезных данных и маркеров. Полезные данные это то, что записывается в приложении производителя и считывается в приложении потребителя. Маркеры используются для организации полезных данных внутри файл CSV.

Следующие правила применяются для всех файлов CSV:

1 Расширение файла должно быть *.csv независимо от вида маркеров.

Это гарантирует правильное считывание файла вместе с маркерами. Три общих 8-битные кодировки: 1252, ISO / IEC 8859-1 и UTF-8.

3 Кроме маркеров ничего не должно быть записано в кодировке ASCII.

Файл CSV не предназначено для хранения двоичных данных. Это правило запрещает использование большинства управляющих символов ASCII.

4 CSV-файл должен содержать хотя бы одну запись.

CSV файл не должен быть пустым (иметь нулевую длину) или состоять только из логического конца. Минимальное количество записей, которые должен содержать CSV файл, это одна запись - заголовок, за которым может следовать 0 и более записей данных.


3. Структура данных в файле

3.1. Записи.

Запись в CSV файле состоит из двух частей: основные данные с разделителями и маркера конца записи. (рис.1)

Рисунок 1. Структура записей в CSV-файле.

3.2. Поля (столбцы)

CSV, как правило, используются для хранения однородных табличных данных. При просмотре в таблице, данные внутри CSV визуально расположены в несколько строк (записей) и столбцов (полей). Отсюда и термин поле столбца.

При фиксированной длине поля относительное местоположение каждого поля внутри записи должно быть фиксировано. Однако, CSV это формат файлов, который позволяет записи переменной длины. Это дает возможность сэкономить значительные пространства по сравнению с форматами фиксированной длины. Для реализации данного подхода используется маркер разделения полезных данных, который указывает на переход от одного поля к другому. Разделителем полей является один символ.

Так же присутствует запись заголовка. Поэтому очень важно, что бы поля в записи следовали в заданном порядке.

На рис.2 показано, где используются символы разделения (SEP) в записи. Вся запись может состоять только из разделителей.

Рисунок 2. Формат записи в CSV-файле.

3.2 Разделители

Хотя имя файла формата Comma-Separated Values - значения, разделённые запятыми предполагает в виде разделителя полей запятую, некоторые приложения используют и другие символы.

Следующие правила применяются для разделителя:

1 Разделитель полей должен быть одним символом.

2 После выбора символа, тот же символ должен использоваться на протяжении всего файла.

3 Производитель приложение должен использовать запятую (ASCII 0x2C) в качестве разделителя полей.

Это правило поднимает один из самых сложных вопросов, с которыми сталкиваются разработчики при реализации кода для обработки файла CSV: разделители, встроенные в полезные данные.

В продолжение темы:
Операционные системы

Ниже перечислены основные объекты 1С, которые используются при работе с управляемыми формами. Даны краткие примеры кода, демонстрирующие традиционное использование данных...

Новые статьи
/
Популярные