Opzioni filtro CSV

Il filtro CSV accetta come opzione una stringa contenente da cinque a quindici token, separati da virgola. I token da 6 a 15 sono facoltativi.

Esempio:

Importazione da UTF-8, lingua tedesca, separato da virgola, delimitatore di testo ", campo tra virgolette come testo. Il file CSV contiene colonne formattate come data, numero, numero, numero:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Esportazione in Windows-1252, delimitatore di campo: virgola, delimitatore di testo: virgolette, Salvataggio del contenuto delle celle come mostrato:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Posizione token

Definizione

Spiegazione ed esempio di token

1

Separatore di campo

Separatori di campo come valori ASCII. I valori multipli sono separati dal segno barra ("/"), ossia, se i valori fossero separati da punti e virgola e tabulatori orizzontali, il token sarebbe 59/9. Per trattare più separatori consequenziali come uno, aggiungere quindi '/MRG' al token. Se il file contiene campi di larghezza fissa, usare allora 'FIX'. Esempio: 44 (,)

2

Delimitatore di testo

Il delimitatore di testo come valore ASCII, come 34 per le virgolette doppie e 39 per le virgolette singole. Esempio: 34 (").

3

Set di caratteri

Il codice del set di caratteri utilizzata nel file come descritto nella tabella sotto riportata. Esempio: 0 (System).

4

Numero di riga da cui iniziare a leggere.

Importazione CSV

N: numero di riga da cui iniziare a leggere. Esempio: 3 (si inizia dalla terza riga).

5

Codici di formato celle per ciascuna colonna

Importazione CSV

Una sequenza di codice di colonna/formattazione, in cui il codice di formattazione è specificato nella tabella sotto riportata. Esempio: "1/5/2/1/3/1/4/1".

Se vengono utilizzati separatori di valori, la forma di questo token è colonna/formato[/colonna/formato/…] dove colonna è il numero della colonna, con 1 che rappresenta la colonna all'estrema sinistra. Il codice del formato è dettagliato sotto.

Se il primo token è FIX, esso ha la forma inizia/formato[/inizia/formato/…], dove inizia è il numero del primo carattere per questo campo, con 0 che rappresenta il carattere all'estrema sinistra in una riga. Il formato è spiegato sotto.

6

Identificatore della lingua

Stringa espressa in notazione decimale. Questo token è l'equivalente della casella di riepilogo "Lingua" nell'interfaccia utente per l'importazione CSV. Se il valore è 0 od omesso, viene utilizzato l'ID della lingua dell'interfaccia utente. L'identificatore della lingua si basa sugli identificatori di lingua di Microsoft.

7

Campo tra virgolette come testo

Stringa, o false o true. Valore predefinito: false. Questo token è l'equivalente della casella di controllo "Campo tra virgolette come testo".

8

Individua numeri speciali

Importazione: stringa, o false o true. Valore predefinito: false. Questo token è l'equivalente della casella di controllo "Individua numeri speciali".

Esportazione: stringa, o false o true. Valore predefinito: true. Questo token non ha un equivalente di interfaccia. Se true, le celle numeriche vengono memorizzate come numeri. Se false, i numeri vengono memorizzati come testo, con delimitatori.

9

Salva il contenuto della cella come mostrato

Esportazione CSV

Stringa, o false o true. Valore predefinito: true. Questo token è l'equivalente della casella di controllo "Salva il contenuto delle celle come mostrato".

10

Esporta le formule delle celle

Esportazione CSV

Stringa, o false o true. Valore predefinito: false. Esporta le formule delle celle.

11

Rimuovi gli spazi

Importazione CSV

Stringa, o false o true. Valore predefinito: false. Rimuove gli spazi. Taglia gli spazi iniziali e finali, durante la lettura del file.

12

Esporta i fogli

Esportazione CSV

Esporta l'intero documento in fogli singoli di file .csv o in un foglio specificato.

  • 0 o assenza: indica il comportamento predefinito, il primo foglio dalla riga di comando o il foglio corrente nelle opzioni del filtro macro, esportato come sample.csv

  • -1: per tutti i fogli, ogni foglio viene esportato in un file singolo del nome file di base concatenato con il nome del foglio, per es. sample-Foglio1.csv, sample-Foglio2.csv e sample-Foglio3.csv

  • N: esporta il foglio N-esimo all'interno dell'intervallo del numero dei fogli. Esempio: per esportare il secondo foglio, impostare qui 2 per ottenere sample-Foglio2.csv

13

Importa come formule

Importazione CSV

Stringa, o false o true. Valore predefinito: false. Determina se le espressioni di formula che cominciano con un carattere di segno uguale = debbano essere considerate formule o importate come dati di testo. Se true vengono considerate formule all'input. Se false le formule sono considerate input testuali. Se omesso (del tutto assente), il valore predefinito è true per mantenere il comportamento delle stringhe di opzioni delle vecchie versioni che non presentavano per nulla questo token. Se presente e vuoto (o qualsiasi altro valore diverso da true) il valore predefinito è false.

14

Include a byte-order-mark (BOM)

String, either false or true. Default value: false. If true include a byte-order-mark (BOM) in the export. If false the export does not include a BOM. If omitted (not present at all), the default value is false to keep the behaviour of old versions' options string that didn't have this token at all. If present and empty (or any other value than true) the default value is false. Automatically detected during the import.

15

Detect numbers in scientific notation

String, either false or true. Default value: true. If true detect if a cell content containing an 'E' or 'e' is a number in scientific notation. If false do not try to detect numbers in scientific notation. Token can be false only if token 8 (Detect special numbers) is false. If omitted, the default value is true to keep the behaviour of old versions' options string that didn't have this token at all.


Caso speciale di file CSV con separatore definito nella prima riga

L'impostazione e l'esportazione CSV supportano una impostazione di separatore di campo sep= e "sep=". Durante la lettura di un documento CSV, il separatore viene preso dal singolo campo sep= o "sep=" iniziale, se esso è l'unico contenuto della riga.

Durante la lettura di un file CSV, viene conservata la forma tra virgolette come contenuto di cella (senza virgolette). Noterete sep=| quando | è il separatore nella prima riga. Nella forma senza virgolette, il separatore viene scartato perché è un vero separatore di campo nel contesto. Noterete sep= nella prima riga.

Durante la scrittura di un file CSV, il contenuto presente della singola cella superiore sinistra come sep=| viene adattato al separatore corrente con la forma racchiusa tra virgolette di "sep=|" (se le virgolette / delimitatori di testo non sono impostati vuoti e | è il separatore) e utilizza sempre il carattere ASCII della virgoletta doppia ".

Se la riga che contiene sep=| non è importata come dati, ricordarsi di impostare a 2 il numero Dalla riga nella finestra di dialogo. Tenere presente che questa riga non verrà preservata quando si salva una seconda volta.

Esempio:


        sep=|
        "LETTERA"|"ANIMALE"
        "a"|"aardvark"
        "b"|"bear"
        "c"|"cow"
    

Codici di formattazione per il token 5

Significato

Codice

Standard

1

Testo

2

MM/GG/AA

3

GG/MM/AA

4

AA/MM/GG

5

-

6

-

7

-

8

Ignora il campo (non importare)

9

Inglese USA

10


Codici per il set di caratteri per il token 3

Set di caratteri

Indice

Sconosciuto

0

Windows-1252/WinLatin 1 (Occidentale)

1

Apple Macintosh (Occidentale)

2

DOS/OS2-437/US (Occidentale)

3

DOS/OS2-850/Internazionale (Occidentale)

4

DOS/OS2-860/Portoghese (Occidentale)

5

DOS/OS2-861/Islandese (Occidentale)

6

DOS/OS2-863/Francese-Canadese (Occidentale)

7

DOS/OS2-865/Nordico (Occidentale)

8

Predefinito di sistema

9

Simbolo

10

ASCII/US (Occidentale)

11

ISO-8859-1 (Occidentale)

12

ISO-8859-2 (Europa centrale)

13

ISO-8859-3 (Latino 3)

14

ISO-8859-4 (Baltico)

15

ISO-8859-5 (Cirillico)

16

ISO-8859-6 (Arabo)

17

ISO-8859-7 (Greco)

18

ISO-8859-8 (Ebraico)

19

ISO-8859-9 (Turco)

20

ISO-8859-14 (Occidentale)

21

ISO-8859-15/EURO (Occidentale)

22

DOS/OS2-737 (Greco)

23

DOS/OS2-775 (Baltico)

24

DOS/OS2-852 (Europa centrale)

25

DOS/OS2-855 (Cirillico)

26

DOS/OS2-857 (Turco)

27

DOS/OS2-862 (Ebraico)

28

DOS/OS2-864 (Arabo)

29

DOS/OS2-866/Russo (Cirillico)

30

DOS/OS2-869/Moderno (Greco)

31

DOS/Windows-874 (Tailandese)

32

Windows-1250/WinLatin 2 (Europa centrale)

33

Windows-1251 (Cirillico)

34

Windows-1253 (Greco)

35

Windows-1254 (Turco)

36

Windows-1255 (Ebraico)

37

Windows-1256 (Arabo)

38

Windows-1257 (Baltico)

39

Windows-1258 (Vietnamita)

40

Apple Macintosh (Arabo)

41

Apple Macintosh (Europa centrale)

42

Apple Macintosh/Croato (Europa centrale)

43

Apple Macintosh (Cirillico)

44

Non supportato: Apple Macintosh (Devanagari)

45

Not supportato: Apple Macintosh (Farsi)

46

Apple Macintosh (Greco)

47

Not supportato: Apple Macintosh (Gujarati)

48

Not supportato: Apple Macintosh (Gurmukhi)

49

Apple Macintosh (Ebraico)

50

Apple Macintosh/Islandese (Occidentale)

51

Apple Macintosh/Rumeno (Europa centrale)

52

Apple Macintosh (Tailandese)

53

Apple Macintosh (Turco)

54

Apple Macintosh/Ucraino (Cirillico)

55

Apple Macintosh (Cinese semplificato)

56

Apple Macintosh (Cinese tradizionale)

57

Apple Macintosh (Giapponese)

58

Apple Macintosh (Coreano)

59

Windows-932 (Giapponese)

60

Windows-936 (Cinese semplificato)

61

Windows-Wansung-949 (Coreano)

62

Windows-950 (Cinese tradizionale)

63

Shift-JIS (Giapponese)

64

GB-2312 (Cinese semplificato)

65

GBT-12345 (Cinese tradizionale)

66

GBK/GB-2312-80 (Cinese semplificato)

67

BIG5 (Cinese tradizionale)

68

EUC-JP (Giapponese)

69

EUC-CN (Cinese semplificato)

70

EUC-TW (Cinese tradizionale)

71

ISO-2022-JP (Giapponese)

72

ISO-2022-CN (Cinese semplificato)

73

KOI8-R (Cirillico)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (Europa centrale)

77

ISO-8859-13 (Europa centrale)

78

EUC-KR (Coreano)

79

ISO-2022-KR (Coreano)

80

JIS 0201 (Giapponese)

81

JIS 0208 (Giapponese)

82

JIS 0212 (Giapponese)

83

Windows-Johab-1361 (Coreano)

84

GB-18030 (Cinese semplificato)

85

BIG5-HKSCS (Cinese tradizionale)

86

TIS 620 (Tailandese)

87

KOI8-U (Cirillico)

88

ISCII Devanagari (Indiano)

89

Unicode (UTF-8 modificato da Java)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Codepage Windows Cirillico asiatico sviluppato in ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535