add support for renaming and post processing of csv columns

2019-12-14 18:11:59 +01:00
parent 1124dc8082
commit 00ba4d2a69
8 changed files with 250 additions and 72 deletions
--- a/pdb-ui/src/test/java/org/lucares/pdbui/CsvToEntryTransformerTest.java
+++ b/pdb-ui/src/test/java/org/lucares/pdbui/CsvToEntryTransformerTest.java
@@ -20,6 +20,7 @@ import org.lucares.collections.LongList;
 import org.lucares.pdb.api.DateTimeRange;
 import org.lucares.pdb.api.Query;
 import org.lucares.pdb.datastore.Entries;
+import org.lucares.pdbui.CsvReaderSettings.ColumnDefinitions;
 import org.lucares.performance.db.PerformanceDb;
 import org.lucares.utils.file.FileUtils;

@@ -49,7 +50,8 @@ public class CsvToEntryTransformerTest {
                    + dateB.format(DateTimeFormatter.ISO_ZONED_DATE_TIME) + ",2,tagValue\n";

            final ArrayBlockingQueue<Entries> queue = db.getQueue();
-            final CsvReaderSettings settings = CsvReaderSettings.create("@timestamp", "duration", ',');
+            final CsvReaderSettings settings = CsvReaderSettings.create("@timestamp", "duration", ',',
+                    new ColumnDefinitions());
            final CsvToEntryTransformer csvToEntryTransformer = new CsvToEntryTransformer(queue, settings);
            csvToEntryTransformer.readCSV(new ByteArrayInputStream(csv.getBytes(StandardCharsets.UTF_8)));
            queue.put(Entries.POISON);
@@ -88,7 +90,10 @@ public class CsvToEntryTransformerTest {
                    + "2000-01-01T00:00:00.001Z,2,ignoreValue,ignoreValue,tagValue\n";

            final ArrayBlockingQueue<Entries> queue = db.getQueue();
-            final CsvReaderSettings settings = CsvReaderSettings.create("@timestamp", "duration", ',', "ignoredColumn");
+            final ColumnDefinitions columnDefinitions = new ColumnDefinitions();
+            columnDefinitions.ignoreColumn("ignoredColumn");
+            final CsvReaderSettings settings = CsvReaderSettings.create("@timestamp", "duration", ',',
+                    columnDefinitions);
            final CsvToEntryTransformer csvToEntryTransformer = new CsvToEntryTransformer(queue, settings);
            csvToEntryTransformer.readCSV(new ByteArrayInputStream(csv.getBytes(StandardCharsets.UTF_8)));
            queue.put(Entries.POISON);
--- a/pdb-ui/src/test/java/org/lucares/pdbui/PdbControllerTest.java
+++ b/pdb-ui/src/test/java/org/lucares/pdbui/PdbControllerTest.java
@@ -3,6 +3,7 @@ package org.lucares.pdbui;
 import java.time.OffsetDateTime;
 import java.time.format.DateTimeFormatter;
 import java.time.temporal.ChronoUnit;
+import java.util.EnumSet;
 import java.util.List;

 import org.apache.logging.log4j.Level;
@@ -13,6 +14,8 @@ import org.junit.jupiter.api.extension.ExtendWith;
 import org.lucares.collections.LongList;
 import org.lucares.pdb.api.DateTimeRange;
 import org.lucares.pdb.api.Query;
+import org.lucares.pdbui.CsvReaderSettings.ColumnDefinitions;
+import org.lucares.pdbui.CsvReaderSettings.PostProcessors;
 import org.lucares.performance.db.PerformanceDb;
 import org.springframework.beans.factory.annotation.Autowired;
 import org.springframework.boot.test.context.SpringBootTest;
@@ -57,14 +60,17 @@ public class PdbControllerTest {

        final String csv = "# first line is a comment\n"//
                + timeColumn + "," + valueColumn + ",tag," + ignoredColumn + "\n"//
-                + dateA.format(DateTimeFormatter.ISO_ZONED_DATE_TIME) + ",1,tagValue,ignoredValue\n"//
-                + dateB.format(DateTimeFormatter.ISO_ZONED_DATE_TIME) + ",2,tagValue,ignoredValue\n";
+                + dateA.format(DateTimeFormatter.ISO_ZONED_DATE_TIME) + ",1,tagVALUE,ignoredValue\n"//
+                + dateB.format(DateTimeFormatter.ISO_ZONED_DATE_TIME) + ",2,TAGvalue,ignoredValue\n";

-        final CsvReaderSettings settings = CsvReaderSettings.create(timeColumn, valueColumn, ',', ignoredColumn);
+        final ColumnDefinitions columnDefinitions = new ColumnDefinitions();
+        columnDefinitions.ignoreColumn(ignoredColumn);
+        columnDefinitions.postProcess("tag", EnumSet.of(PostProcessors.LOWER_CASE));
+        final CsvReaderSettings settings = CsvReaderSettings.create(timeColumn, valueColumn, ',', columnDefinitions);
        settings.putAdditionalTag(additionalColumn, additionalValue);
        uploadCsv(settings, csv);
        {
-            final LongList resultTagValue = performanceDb.get(new Query("tag=tagValue", DateTimeRange.ofDay(dateA)))
+            final LongList resultTagValue = performanceDb.get(new Query("tag=tagvalue", DateTimeRange.ofDay(dateA)))
                    .singleGroup().flatMap();
            final LongList resultAdditionalValue = performanceDb
                    .get(new Query(additionalColumn + "=" + additionalValue, DateTimeRange.ofDay(dateA))).singleGroup()