Επιλογές φίλτρου CSV

The CSV filter accepts an option string containing five to fifteen tokens, separated by commas. Tokens 6 to 15 are optional.

Παράδειγμα:

Εισαγωγή από UTF-8, Γλώσσα Γερμανικά, Διαχωρισμένα με κόμματα, Οριοθέτηση κειμένου ", Πεδίο αναφοράς ως κείμενο. Το αρχείο CSV έχει στήλες μορφοποιημένες ως ημερομηνία, αριθμό, αριθμό, αριθμό:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Εξαγωγή σε Windows-1252, Οριοθέτης πεδίου : κόμμα, Οριοθέτης κειμένου : εισαγωγικό, Αποθήκευση περιεχομένων κελιού όπως φαίνεται:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Θέση διακριτικού

Ορισμός

Σημασία και παράδειγμα διακριτικού (Token)

1

Διαχωριστικό πεδίου

Διαχωριστικά πεδίων ως τιμές ASCII. Πολλαπλές τιμές διαχωρίζονται με το σύμβολο πλάγιας κάθετου ("/"), δηλαδή, εάν οι τιμές διαχωρίζονται με λατινικά (;) και οριζόντιους στηλοθέτες, το διακριτικό θα είναι 59/9. Για να αντιμετωπίσετε πολλά διαδοχικά διαχωριστικά ως ένα, προσθέστε το '/MRG' στο διακριτικό. Εάν το αρχείο περιέχει πεδία σταθερού πλάτους, χρησιμοποιήστε το 'FIX'. Παράδειγμα: 44 (,)

2

Οριοθέτης κειμένου

Ο οριοθέτης κειμένου ως τιμή ASCII, όπως 34 για διπλά εισαγωγικά και 39 για μονά εισαγωγικά. Παράδειγμα: 34 (").

3

Σύνολο χαρακτήρων

Ο κωδικός συνόλου χαρακτήρων που χρησιμοποιείται στο αρχείο όπως περιγράφεται στον παρακάτω πίνακα. Παράδειγμα: 0 (Σύστημα).

4

Αριθμός γραμμής για να ξεκινήσετε την ανάγνωση.

Εισαγωγή CSV

N: αριθμός γραμμής για έναρξη ανάγνωσης. Παράδειγμα: 3 (ξεκινήστε από τρίτη γραμμή).

5

Κωδικοί μορφής κελιού για κάθε στήλη

Εισαγωγή CSV

Μια ακολουθία κώδικα στήλης/μορφοποίησης, όπου ο κώδικας μορφοποίησης δίνεται στον παρακάτω πίνακα. Παράδειγμα: "1/5/2/1/3/1/4/1".

Εάν χρησιμοποιούνται διαχωριστικά τιμών, η μορφή αυτού του διακριτικού είναι στήλη/μορφή[/στήλη/μορφή/…] όπου στήλη είναι ο αριθμός της στήλης, με το 1 να είναι η πιο αριστερή στήλη. Ο κωδικός μορφής περιγράφεται αναλυτικά παρακάτω.

Εάν το πρώτο διακριτικό είναι FIX, έχει τη μορφή έναρξη/μορφή[/start/format/…], όπου η αρχή είναι ο αριθμός του πρώτου χαρακτήρα για αυτό το πεδίο, με το 0 να είναι ο πιο αριστερός χαρακτήρας σε μια γραμμή. Η μορφή εξηγείται παρακάτω.

6

Αναγνωριστικό γλώσσας

Συμβολοσειρά που εκφράζεται με δεκαδικό συμβολισμό. Αυτό το διακριτικό είναι το ισοδύναμο του πλαισίου καταλόγου "Γλώσσα" στη διεπαφή χρήστη για εισαγωγή CSV. Εάν η τιμή είναι 0 ή παραλειφθεί, χρησιμοποιείται το αναγνωριστικό γλώσσας της διεπαφής χρήστη. Το αναγνωριστικό γλώσσας βασίζεται στα αναγνωριστικά γλώσσας της Microsoft.

7

Πεδίο με εισαγωγικά ως κείμενο

Συμβολοσειρά, είτε false, είτε true. Προεπιλεγμένη τιμή: false. Αυτό το διακριτικό είναι το ισοδύναμο του πλαισίου ελέγχου "Πεδίο αναφοράς ως κείμενο".

8

Ανίχνευση ειδικών αριθμών

Εισαγωγή: Συμβολοσειρά, είτε false είτε true. Προεπιλεγμένη τιμή: false. Αυτό το διακριτικό είναι το ισοδύναμο του πλαισίου ελέγχου "Εντοπισμός ειδικών αριθμών".

Export: String, either false or true. Default value: true. This token has no UI equivalent. If true, the number cells are stored as numbers. If false, the numbers are stored as text, with text delimiters.

9

Αποθήκευση των περιεχομένων του κελιού όπως φαίνεται

Εξαγωγή CSV

Συμβολοσειρά, είτε false, είτε true. Προεπιλεγμένη τιμή:true. Αυτό το διακριτικό είναι το ισοδύναμο του πλαισίου ελέγχου "Αποθήκευση περιεχομένων κελιού όπως φαίνεται".

10

Εξαγωγή τύπων κελιών

Εξαγωγή CSV

Συμβολοσειρά, είτε false, είτε true. Προεπιλεγμένη τιμή: false. Εξαγωγή τύπων κελιών.

11

Αφαίρεση κενών

Εισαγωγή CSV

Συμβολοσειρά, είτε false, είτε true. Προεπιλεγμένη τιμή: false. Αφαιρέστε τα κενά. Περικόψτε τα αρχικά και τελικά κενά κατά την ανάγνωση του αρχείου.

12

Εξαγωγή φύλλων

Εξαγωγή CSV

Εξαγωγή ολόκληρου του εγγράφου σε αρχεία .csv μεμονωμένων φύλλων ή σε ένα καθορισμένο φύλλο.

  • 0 ή απουσιάζει: σημαίνει την προεπιλεγμένη συμπεριφορά, το πρώτο φύλλο από τη γραμμή εντολών ή το τρέχον φύλλο στις επιλογές φίλτρου μακροεντολών, που εξάγεται στο sample.csv

  • -1: για όλα τα φύλλα, κάθε φύλλο εξάγεται σε ένα μεμονωμένο αρχείο του ονόματος του αρχείου βάσης που συνδέεται με το όνομα του φύλλου, για παράδειγμα sample-Sheet1.csv, sample-Sheet2.csv και sample-Sheet3 .csv

  • N: εξάγετε το Ν-ο φύλλο εντός του εύρους του αριθμού των φύλλων. Παράδειγμα: για να εξαγάγετε το δεύτερο φύλλο, ορίστε το 2 εδώ για να λάβετε το sample-Sheet2.csv

13

Εισαγωγή ως τύποι

Εισαγωγή CSV

Συμβολοσειρά, είτε false είτε true. Προεπιλεγμένη τιμή: false. Καθορίζει εάν οι εκφράσεις τύπου που ξεκινούν με σύμβολο χαρακτήρα = ίσον θα αξιολογηθούν ως τύποι ή θα εισαχθούν ως δεδομένα κειμένου. Εάν true αξιολόγηση των τύπων στην εισαγωγή. Εάν οι τύποι false εισάγονται ως κείμενο. Εάν παραλειφθεί (δεν υπάρχει καθόλου), η προεπιλεγμένη τιμή είναι true για να διατηρηθεί η συμπεριφορά της συμβολοσειράς επιλογών των παλιών εκδόσεων που δεν είχαν καθόλου αυτό το διακριτικό. Εάν υπάρχει και είναι κενή (ή οποιαδήποτε άλλη τιμή εκτός από το true), η προεπιλεγμένη τιμή είναι false.

14

Include a byte-order-mark (BOM)

String, either false or true. Default value: false. If true include a byte-order-mark (BOM) in the export. If false the export does not include a BOM. If omitted (not present at all), the default value is false to keep the behaviour of old versions' options string that didn't have this token at all. If present and empty (or any other value than true) the default value is false. Automatically detected during the import.

15

Detect numbers in scientific notation

String, either false or true. Default value: true. If true detect if a cell content containing an 'E' or 'e' is a number in scientific notation. If false do not try to detect numbers in scientific notation. Token can be false only if token 8 (Detect special numbers) is false. If omitted, the default value is true to keep the behaviour of old versions' options string that didn't have this token at all.


Ειδική περίπτωση αρχείων CSV με διαχωριστικό που ορίζεται στην πρώτη γραμμή

Η εισαγωγή και η εξαγωγή CSV υποστηρίζουν μια ρύθμιση διαχωριστικού πεδίων sep= και "sep=". Κατά την ανάγνωση ενός εγγράφου CSV, το διαχωριστικό λαμβάνεται από το αρχικό μοναδικό πεδίο sep= ή "sep=", εάν αυτό είναι το μόνο περιεχόμενο γραμμής.

Κατά την ανάγνωση ενός αρχείου CSV, η φόρμα σε εισαγωγικά διατηρείται ως περιεχόμενο κελιού (χωρίς εισαγωγικά).Δείτε sep=| όταν | είναι το διαχωριστικό στην πρώτη γραμμή. Στη μορφή χωρίς εισαγωγικά, το διαχωριστικό απορρίπτεται επειδή είναι ένα πραγματικό διαχωριστικό πεδίου στο περιβάλλον. Δείτε sep= στην πρώτη γραμμή.

Κατά τη σύνταξη ενός αρχείου CSV, το περιεχόμενο του υπάρχοντος μεμονωμένου επάνω αριστερού κελιού, όπως sep=| προσαρμόζεται στο τρέχον διαχωριστικό με την εισαγωγική μορφή του "sep=|" (εάν τα εισαγωγικά / οριοθέτες κειμένου δεν ορίζονται κενά και το | είναι το διαχωριστικό) και χρησιμοποιεί πάντα τον χαρακτήρα " διπλού εισαγωγικού ASCII.

Εάν η γραμμή που περιέχει το sep=| δεν πρόκειται να εισαχθεί ως δεδομένα, θυμηθείτε να ορίσετε τον αριθμό Από τη γραμμή στο παράθυρο διαλόγου σε 2. Σημειώστε ότι αυτή η γραμμή δεν θα διατηρηθεί κατά την εκ νέου αποθήκευση.

Παράδειγμα:


        sep=|
        "LETTER"|"ANIMAL"
        "a"|"aardvark"
        "b"|"bear"
        "c"|"cow"
    

Μορφοποίηση κωδικών για Διακριτικό (Token) 5

Σημασία

Κωδικός

Τυπικός

1

Κείμενο

2

MM/DD/YY (ΜΜ/ΗΗ/ΕΕ)

3

DD/MM/YY (ΗΗ/ΜΜ/ΕΕ)

4

YY/MM/DD (ΕΕ/ΜΜ/ΗΗ)

5

-

6

-

7

-

8

Αγνόηση πεδίου (μη εισαγωγή)

9

Αγγλικά-US

10


Κωδικοί συνόλου χαρακτήρων για διακριτικό 3

Σύνολο χαρακτήρων

Ευρετήριο

Άγνωστο

0

Windows-1252/WinLatin 1 (Δυτικό)

1

Apple Macintosh (Δυτικό)

2

DOS/OS2-437/US (Δυτικό)

3

DOS/OS2-850/Διεθνές (Δυτικό)

4

DOS/OS2-860/Πορτογαλικό (Δυτικό)

5

DOS/OS2-861/Ισλανδίας (Δυτικό)

6

DOS/OS2-863/Καναδικό-Γαλλικά (Δυτικό)

7

DOS/OS2-865/σκανδιναβικό (Δυτικό)

8

Προεπιλογή συστήματος

9

Σύμβολο

10

ASCII/US (Δυτικό)

11

ISO-8859-1 (Δυτικό)

12

ISO-8859-2 (Κεντρικής Ευρώπης)

13

ISO-8859-3 (Λατινικό 3)

14

ISO-8859-4 (Βαλτικής)

15

ISO-8859-5 (Κυριλικό)

16

ISO-8859-6 (Αραβικό)

17

ISO-8859-7 (Ελληνικό)

18

ISO-8859-8 (Εβραϊκό)

19

ISO-8859-9 (Τουρκικό)

20

ISO-8859-14 (Δυτικό)

21

ISO-8859-15/ΕΥΡΩ (Δυτικό)

22

DOS/OS2-737 (Ελληνικό)

23

DOS/OS2-775 (Βαλτικής)

24

DOS/OS2-852 (Κεντρικής Ευρώπης)

25

DOS/OS2-855 (Κυριλικό)

26

DOS/OS2-857 (Τουρκικό)

27

DOS/OS2-862 (Εβραϊκό)

28

DOS/OS2-864 (Αραβικό)

29

DOS/OS2-866/Ρωσικό (Κυριλλικό)

30

DOS/OS2-869/Σύγχρονα (Ελληνικά)

31

DOS/Windows-874 (Τάι)

32

Windows-1250/WinLatin 2 (Κεντρικής Ευρώπης)

33

Windows-1251 (Κυριλλικό)

34

Windows-1253 (Ελληνικό)

35

Windows-1254 (Τουρκικό)

36

Windows-1255 (Εβραϊκό)

37

Windows-1256 (Αραβικό)

38

Windows-1257 (Βαλτικής)

39

Windows-1258 (Βιετναμέζικο)

40

Apple Macintosh (Αραβικό)

41

Apple Macintosh (Κεντρικής Ευρώπης)

42

Apple Macintosh/Κροατικό (Κεντρικής Ευρώπης)

43

Apple Macintosh (Κυριλλικό)

44

Not supported: Apple Macintosh (Ντεβαναγκάρι)

45

Μη υποστηριζόμενο: Apple Macintosh (Φαρσί)

46

Apple Macintosh (Ελληνικό)

47

Μη υποστηριζόμενο: Apple Macintosh (Γκουτζαράτι)

48

Μη υποστηριζόμενο: Apple Macintosh (Γκουρμούκι)

49

Apple Macintosh (Εβραϊκό)

50

Apple Macintosh/Ισλανδίας (Δυτικό)

51

Apple Macintosh/Ρουμανικό (Κεντρικής Ευρώπης)

52

Apple Macintosh (Τάι)

53

Apple Macintosh (Τουρκικό)

54

Apple Macintosh/Ουκρανικό (Κυριλλικό)

55

Apple Macintosh (Απλοποιημένο κινέζικο)

56

Apple Macintosh (Παραδοσιακό κινέζικο)

57

Apple Macintosh (Ιαπωνικό)

58

Apple Macintosh (Κορεατικό)

59

Windows-932 (Ιαπωνικό)

60

Windows-936 (Απλοποιημένο κινέζικο)

61

Windows-Wansung-949 (Κορεατικό)

62

Windows-950 (Παραδοσιακό κινέζικο)

63

Shift-JIS (Ιαπωνικό)

64

GB-2312 (Απλοποιημένο κινέζικο)

65

GBT-12345 (Παραδοσιακό κινέζικο)

66

GBK/GB-2312-80 (Απλοποιημένο κινέζικο)

67

BIG5 (Παραδοσιακό κινέζικο)

68

EUC-JP (Ιαπωνικό)

69

EUC-CN (Απλοποιημένο κινέζικο)

70

EUC-TW (Παραδοσιακό κινέζικο)

71

ISO-2022-JP (Ιαπωνικό)

72

ISO-2022-CN (Απλοποιημένο κινέζικο)

73

KOI8-R (Κυριλλικό)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (Κεντρικής Ευρώπης)

77

ISO-8859-13 (Κεντρικής Ευρώπης)

78

EUC-KR (Κορεατικό)

79

ISO-2022-KR (Κορεατικό)

80

JIS 0201 (Ιαπωνικό)

81

JIS 0208 (Ιαπωνικό)

82

JIS 0212 (Ιαπωνικό)

83

Windows-Johab-1361 (Κορεατικό)

84

GB-18030 (Απλοποιημένο κινέζικο)

85

BIG5-HKSCS (Απλοποιημένο κινέζικο)

86

TIS 620 (Τάι)

87

KOI8-U (Κυριλλικό)

88

ISCII Ντεβαναγκάρι (Ινδικό)

89

Unicode (Τροποποιημένο UTF-8 Ιάβας)

90

Τυπικό Adobe

91

Σύμβολα Adobe

92

PT 154 (κωδικογραφία των Windows Κυριλλικό Ασιατικό που αναπτύχθηκε σε ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535