CSV-Filteroptionen

Der CSV-Filter akzeptiert eine Optionszeichenfolge mit fünf bis dreizehn Token, getrennt durch Kommata. Token 6 bis 13 sind optional.

Beispiel:

Import aus UTF-8, Sprache Deutsch, Kommagetrennt, Texttrennzeichen ", Angeführtes Feld als Text. CSV-Datei hat Spalten, die als Datum, Zahl, Zahl, Zahl formatiert sind:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Export nach Windows-1252, Feldtrennzeichen: Komma, Texttrennzeichen: Anführungszeichen, Zelleninhalt wie gezeigt speichern:

soffice --convert-to "Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Token-Position

Definition

Bedeutung und Beispiel von Token

1

Feldtrennzeichen

Feldtrennzeichen als ASCII-Werte. Mehrere Werte werden durch den Schrägstrich ("/") getrennt, das heißt, wenn die Werte durch Semikola und horizontale Tabulatoren getrennt sind, wäre der Token 59/9. Um mehrere aufeinanderfolgende Trennzeichen als eines zu behandeln, hängen Sie "/MRG" an den Token an. Wenn die Datei Felder mit fester Breite enthält, verwenden Sie „FIX“. Beispiel: 44 (,)

2

Texttrennzeichen

Das Texttrennzeichen als ASCII-Wert, also 34 für doppelte Anführungszeichen und 39 für einfache Anführungszeichen. Beispiel: 34 (").

3

Zeichensatz

Der in der Datei verwendete Zeichensatzcode, wie in der folgenden Tabelle beschrieben. Beispiel: 0 (System).

4

Nummer der ersten Zeile

Zeilennummer, in der mit dem Lesen begonnen wird. Beispiel: 3 (beginnt mit der dritten Zeile).

5

Zellformatcodes für jede Spalte

Eine Folge von Spalten-/Formatierungscodes, wobei der Formatierungscode in der folgenden Tabelle angegeben ist. Beispielsweise: "1/5/2/1/3/1/4/1".

Wenn Werttrennzeichen verwendet werden, ist die Form dieses Tokens Spalte/Format[/Spalte/Format/…], wobei Spalte die Nummer der Spalte ist, mit 1 der Spalte ganz links. Der Formatcode ist unten aufgeführt.

Wenn der erste Token "FIX" ist, hat es die Form start/format[/start/format/…], wobei "start" die Nummer des ersten Zeichens für dieses Feld ist, mit 0 dem Zeichen ganz links in einer Zeile. Das Format wird unten erklärt.

6

Sprachkennung

Zeichenfolge in Dezimalschreibweise. Dieser Token entspricht dem Listenfeld "Sprache" in der Benutzeroberfläche für den CSV-Import. Wenn der Wert 0 ist oder weggelassen wird, wird die Sprachkennung der Benutzeroberfläche verwendet. Die Sprachkennung basiert auf den Microsoft-Sprachkennungen.

7

CSV-Import, CSV-Export

Zeichenfolge, entweder false oder true. Standardwert: false. Dieser Token ist das Äquivalent zum Markierfeld „Werte in Hochkommata als Text formatieren“.

8

CSV-Import, CSV-Export

Import: Zeichenfolge, entweder false oder true. Standardwert: false. Dieser Token ist das Äquivalent zum Markierfeld „Erweiterte Zahlerkennung“.

Export: Zeichenfolge, entweder "false" oder "true". Standardwert: true. Dieser Token hat kein UI-Äquivalent. Wenn true, werden Zahlzellen als Zahlen gespeichert. Bei false werden Zahlen als Text mit Texttrennzeichen gespeichert.

9

CSV-Export

Zeichenfolge, entweder false oder true. Standardwert:true. Dieser Token ist das Äquivalent zum Markierfeld "Zelleninhalte wie angezeigt speichern".

10

CSV-Export

Zeichenfolge, entweder false oder true. Standardwert: false. Exportiert Zellformeln.

11

CSV-Import

Zeichenfolge, entweder false oder true. Standardwert: false. Entfernt Leerzeichen. Führende und abschließende Leerzeichen werden beim Lesen der Datei abgeschnitten.

12

CSV-Export

Exportiert das gesamte Dokument mit einer CSV-Datei je Tabelle oder eine bestimmte Tabelle.

  • 0 oder nicht vorhanden bedeutet das Standardverhalten, erste Tabelle von der Befehlszeile oder aktuelle Tabelle in den Makrofilteroptionen, exportiert nach sample.csv

  • -1 für alle Tabellen, jede Tabelle wird in eine einzelne Datei mit dem Basisdateinamen exportiert, der mit dem Tabellennamen verkettet ist, beispielsweise sample-Tabelle1.csv, sample-Tabelle2.csv und sample-Tabelle3.csv

  • N exportiert die N-te Tabelle innerhalb des Bereichs der Tabellenzahl. Um beispielsweise die zweite Tabelle zu exportieren, geben Sie hier 2 ein, um sample-Tabelle2.csv zu erhalten

13

CSV-Import

Zeichenfolge, entweder false oder true. Standardwert: false. Legt fest, ob Formelausdrücke, die mit einem Gleichheitszeichen "=" beginnen, als Formeln ausgewertet oder als Textdaten importiert werden sollen. Wenn true werden Formeln bei der Eingabe auswerten. Bei false werden Formeln als Text übernommen. Wenn weggelassen (überhaupt nicht vorhanden), ist der Standardwert true, um das Verhalten der Optionszeichenfolge alter Versionen beizubehalten, die diesen Token überhaupt nicht hatten. Wenn vorhanden und leer (oder ein anderer Wert als true), ist der Standardwert false.


Sonderfall von CSV-Dateien mit in der ersten Zeile definiertem Trennzeichen

CSV-Import und -Export unterstützen eine sep=- und "sep="-Feldtrennzeicheneinstellung. Beim Lesen eines CSV-Dokuments wird das Trennzeichen aus dem initialen sep= bzw. "sep=" Einzelfeld genommen, wenn dies der einzige Zeileninhalt ist.

Beim Lesen einer CSV-Datei bleibt die in Anführungszeichen gesetzte Form als (nicht in Anführungszeichen gesetzter) Zellinhalt erhalten. Sie sehen sep=| wenn | das Trennzeichen in der ersten Zeile ist. In der Form ohne Anführungszeichen wird das Trennzeichen verworfen, da es sich im Kontext um ein echtes Feldtrennzeichen handelt. In der ersten Zeile sehen Sie sep=.

Beim Schreiben einer CSV-Datei wird der Inhalt der vorhandenen einzelnen Zelle oben links wie sep=| an das aktuelle Trennzeichen mit der Anführungszeichenform von "sep=|" angepasst (falls Anführungszeichen / Texttrennzeichen nicht leer gesetzt werden und | das Trennzeichen ist) und immer das doppelte ASCII-Anführungszeichen " verwendet.

Wenn die Zeile mit sep=| nicht als Daten importiert werden soll, denken Sie daran, die Nummer Ab Zeile im Dialog auf 2 zu setzen. Beachten Sie, dass diese Zeile nicht importiert wird beim erneuten Speichern erhalten bleibt.

Beispiel:


        sep=|
        "BUCHSTABE"|"TIER"
        "A"|"Affe"
        "B"|"Bär"
        "C"|"Chamäleon"
    

Formatierungscodes für Token 5

Bedeutung

Code

Standard

1

Text

2

MM/TT/JJ

3

TT/MM/JJ

4

JJ/MM/TT

5

-

6

-

7

-

8

Feld ignorieren (nicht importieren)

9

US-Englisch

10


Zeichensatzcodes für Token 3

Character set

Index

Unknown

0

Windows-1252/WinLatin 1 (Western)

1

Apple Macintosh (Western)

2

DOS/OS2-437/US (Western)

3

DOS/OS2-850/International (Western)

4

DOS/OS2-860/Portuguese (Western)

5

DOS/OS2-861/Icelandic (Western)

6

DOS/OS2-863/Canadian-French (Western)

7

DOS/OS2-865/Nordic (Western)

8

System default

9

Symbol

10

ASCII/US (Western)

11

ISO-8859-1 (Western)

12

ISO-8859-2 (Central European)

13

ISO-8859-3 (Latin 3)

14

ISO-8859-4 (Baltic)

15

ISO-8859-5 (Cyrillic)

16

ISO-8859-6 (Arabic)

17

ISO-8859-7 (Greek)

18

ISO-8859-8 (Hebrew)

19

ISO-8859-9 (Turkish)

20

ISO-8859-14 (Western)

21

ISO-8859-15/EURO (Western)

22

DOS/OS2-737 (Greek)

23

DOS/OS2-775 (Baltic)

24

DOS/OS2-852 (Central European)

25

DOS/OS2-855 (Cyrillic)

26

DOS/OS2-857 (Turkish)

27

DOS/OS2-862 (Hebrew)

28

DOS/OS2-864 (Arabic)

29

DOS/OS2-866/Russian (Cyrillic)

30

DOS/OS2-869/Modern (Greek)

31

DOS/Windows-874 (Thai)

32

Windows-1250/WinLatin 2 (Central European)

33

Windows-1251 (Cyrillic)

34

Windows-1253 (Greek)

35

Windows-1254 (Turkish)

36

Windows-1255 (Hebrew)

37

Windows-1256 (Arabic)

38

Windows-1257 (Baltic)

39

Windows-1258 (Vietnamese)

40

Apple Macintosh (Arabic)

41

Apple Macintosh (Central European)

42

Apple Macintosh/Croatian (Central European)

43

Apple Macintosh (Cyrillic)

44

Not supported: Apple Macintosh (Devanagari)

45

Not supported: Apple Macintosh (Farsi)

46

Apple Macintosh (Greek)

47

Not supported: Apple Macintosh (Gujarati)

48

Not supported: Apple Macintosh (Gurmukhi)

49

Apple Macintosh (Hebrew)

50

Apple Macintosh/Icelandic (Western)

51

Apple Macintosh/Romanian (Central European)

52

Apple Macintosh (Thai)

53

Apple Macintosh (Turkish)

54

Apple Macintosh/Ukrainian (Cyrillic)

55

Apple Macintosh (Chinese Simplified)

56

Apple Macintosh (Chinese Traditional)

57

Apple Macintosh (Japanese)

58

Apple Macintosh (Korean)

59

Windows-932 (Japanese)

60

Windows-936 (Chinese Simplified)

61

Windows-Wansung-949 (Korean)

62

Windows-950 (Chinese Traditional)

63

Shift-JIS (Japanese)

64

GB-2312 (Chinese Simplified)

65

GBT-12345 (Chinese Traditional)

66

GBK/GB-2312-80 (Chinese Simplified)

67

BIG5 (Chinese Traditional)

68

EUC-JP (Japanese)

69

EUC-CN (Chinese Simplified)

70

EUC-TW (Chinese Traditional)

71

ISO-2022-JP (Japanese)

72

ISO-2022-CN (Chinese Simplified)

73

KOI8-R (Cyrillic)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (Central European)

77

ISO-8859-13 (Central European)

78

EUC-KR (Korean)

79

ISO-2022-KR (Korean)

80

JIS 0201 (Japanese)

81

JIS 0208 (Japanese)

82

JIS 0212 (Japanese)

83

Windows-Johab-1361 (Korean)

84

GB-18030 (Chinese Simplified)

85

BIG5-HKSCS (Chinese Traditional)

86

TIS 620 (Thai)

87

KOI8-U (Cyrillic)

88

ISCII Devanagari (Indian)

89

Unicode (Java's modified UTF-8)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Windows Cyrillic Asian codepage developed in ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535