Java8 bietet neue Funktionen für die Verarbeitung von Streaming-Daten-javaLernprogramm-php.cn

Zusammenfassung: Die Streaming-Datenverarbeitung von Java8 vereinfacht unsere Operationen an Strukturen wie Sammlungen und Arrays erheblich und ermöglicht es uns, mit funktionalem Denken zu arbeiten. In diesem Artikel wird die grundlegende Verwendung der Streaming-Datenverarbeitung von Java8 untersucht.

1. Einführung in das Streaming

Als ich mit Java8-Streaming in Kontakt kam, war mein erster Eindruck, dass Streaming die Erfassungsvorgänge vereinfacht. Viele Vorgänge, die normalerweise mehrere Zeilen erfordern Code kann mithilfe von Streaming in einer Zeile implementiert werden. Wenn wir beispielsweise alle geraden Zahlen aus einer Sammlung von Ganzzahlen herausfiltern und in eine neue Liste einkapseln möchten, müssen wir dies vor Java 8 durch den folgenden Code implementieren:

List<Integer> evens = new ArrayList<>();
for (final Integer num : nums) {
    if (num % 2 == 0) {
        evens.add(num);
    }
}

Nach dem Login kopieren

Durch die Streaming-Verarbeitung von Java8 können wir den Code wie folgt vereinfachen:

List<Integer> evens = nums.stream().filter(num -> num % 2 == 0).collect(Collectors.toList());

Nach dem Login kopieren

Erklären Sie zunächst kurz die Bedeutung der obigen Anweisungszeile
Die Operation

stream()

Nach dem Login kopieren

wandelt die Sammlung in einen Stream um,

filter()

Nach dem Login kopieren

führt unseren benutzerdefinierten Filterprozess durch, hier filtern wir alle geraden Zahlen durch Lambda-Ausdrücke heraus und übergeben schließlich

collect()

Nach dem Login kopieren

kapselt das Ergebnis und gibt es als Listensammlung zurück, indem seine Kapselung über

Collectors.toList()

Nach dem Login kopieren

angegeben wird.

Wie aus dem obigen Beispiel ersichtlich ist, vereinfacht die Streaming-Verarbeitung von Java8 den Betrieb von Sammlungen erheblich. Tatsächlich handelt es sich nicht nur um Sammlungen, einschließlich Arrays, Dateien usw., solange sie konvertiert werden können Einen Stream können wir mit der Streaming-Verarbeitung ähnlich wie beim Schreiben von SQL-Anweisungen betreiben. Java8 implementiert die Stream-Verarbeitung durch interne Iteration. Eine Stream-Verarbeitung kann in drei Teile unterteilt werden: Konvertierung in Stream, Zwischenoperation und Terminaloperation. Wie unten gezeigt:

Java8 bietet neue Funktionen für die Verarbeitung von Streaming-Daten

Nehmen wir als Beispiel eine Sammlung: Für einen Streaming-Vorgang müssen wir zunächst die Funktion

stream()

Nach dem Login kopieren

aufrufen, um sie in eine Sammlung umzuwandeln einen Stream und dann Rufen Sie dann das entsprechende

中间操作

Nach dem Login kopieren

auf, um die Vorgänge zu erreichen, die wir für die Sammlung ausführen müssen, z. B. Filterung, Konvertierung usw., und verwenden Sie schließlich

终端操作

Nach dem Login kopieren

um die vorherigen Ergebnisse zu kapseln und das zurückzugeben, was wir brauchen.

2. Zwischenoperationen

Wir definieren eine einfache Student-Entitätsklasse zur Demonstration in den folgenden Beispielen:

public class Student {
    /** 学号 */
    private long id;
    private String name;
    private int age;
    /** 年级 */
    private int grade;
    /** 专业 */
    private String major;
    /** 学校 */
    private String school;
    // 省略getter和setter
}
// 初始化
List<Student> students = new ArrayList<Student>() {
    {
        add(new Student(20160001, "孔明", 20, 1, "土木工程", "武汉大学"));
        add(new Student(20160002, "伯约", 21, 2, "信息安全", "武汉大学"));
        add(new Student(20160003, "玄德", 22, 3, "经济管理", "武汉大学"));
        add(new Student(20160004, "云长", 21, 2, "信息安全", "武汉大学"));
        add(new Student(20161001, "翼德", 21, 2, "机械与自动化", "华中科技大学"));
        add(new Student(20161002, "元直", 23, 4, "土木工程", "华中科技大学"));
        add(new Student(20161003, "奉孝", 23, 4, "计算机科学", "华中科技大学"));
        add(new Student(20162001, "仲谋", 22, 3, "土木工程", "浙江大学"));
        add(new Student(20162002, "鲁肃", 23, 4, "计算机科学", "浙江大学"));
        add(new Student(20163001, "丁奉", 24, 5, "土木工程", "南京大学"));
    }
};

Nach dem Login kopieren

2.1 Filtern

Filtern besteht, wie der Name schon sagt, darin, die Elemente, die die Bedingungen in der Sammlung erfüllen, gemäß den gegebenen Anforderungen zu filtern. Die von Java8 bereitgestellten Filteroperationen umfassen: Filtern, Unterscheiden, Begrenzen und Überspringen .

Filter

Im vorherigen Beispiel haben wir gezeigt, wie man Filter verwendet, der wie folgt definiert ist:

Stream<T> filter(Predicate<? super T> predicate)

Nach dem Login kopieren

, Filter akzeptiert ein Prädikat

Predicate

Nach dem Login kopieren

, wir können Filterbedingungen durch dieses Prädikat definieren. Bei der Einführung von Lambda-Ausdrücken haben wir eingeführt, dass

Predicate

Nach dem Login kopieren

eine funktionale Schnittstelle ist, die ein

test(T t)

Nach dem Login kopieren

enthält

-Methode, die

boolean

Nach dem Login kopieren

zurückgibt. Jetzt möchten wir alle Studenten der Wuhan-Universität aus der Sammlung

students

Nach dem Login kopieren

herausfiltern, dann können wir dies über Filter tun und die Filteroperation als Parameter an den Filter übergeben:

List<Student> whuStudents = students.stream()
                                    .filter(student -> "武汉大学".equals(student.getSchool()))
                                    .collect(Collectors.toList());

Nach dem Login kopieren

distinct

Die Operation „distinct“ ähnelt dem Schlüsselwort

DISTINCT

Nach dem Login kopieren

, das wir beim Schreiben von SQL-Anweisungen hinzufügen und das zur Neuverarbeitung verwendet wird , „distinct“ wird basierend auf

Object.equals(Object)

Nach dem Login kopieren

implementiert. Wenn wir zum ursprünglichen Beispiel zurückkehren und davon ausgehen, dass wir alle sich nicht wiederholenden geraden Zahlen herausfiltern möchten, können wir die „distinct“-Operation hinzufügen:

List<Integer> evens = nums.stream()
                        .filter(num -> num % 2 == 0).distinct()
                        .collect(Collectors.toList());

Nach dem Login kopieren

limit

Die Limit-Operation ähnelt auch dem Schlüsselwort

LIMIT

Nach dem Login kopieren

in der SQL-Anweisung, jedoch der Funktion ist relativ schwach, limit gibt einen Stream zurück, der die ersten n Elemente enthält. Wenn die Mengengröße kleiner als n ist, wird die tatsächliche Länge zurückgegeben. Das folgende Beispiel gibt beispielsweise Studenten zurück, deren erste beiden Hauptfächer

土木工程

Nach dem Login kopieren

<🎜 sind >:

List<Student> civilStudents = students.stream()
                                    .filter(student -> "土木工程".equals(student.getMajor())).limit(2)
                                    .collect(Collectors.toList());

Nach dem Login kopieren

Apropos Limit, ich muss noch einen weiteren Stream-Betrieb erwähnen:

sorted

Nach dem Login kopieren

. Diese Operation wird zum Sortieren der Elemente im Stream verwendet. Die zu vergleichenden Elemente müssen die Schnittstelle

Comparable

Nach dem Login kopieren

implementieren. Es spielt keine Rolle, ob sie nicht implementiert ist als Parameter für

sorted(Comparator<? super T> comparator)

Nach dem Login kopieren

, wenn wir beispielsweise Studenten mit Hauptfach Bauingenieurwesen herausfiltern, sie nach Alter vom jüngsten zum ältesten sortieren und die beiden jüngsten Studenten herausfiltern möchten, dann kann dies der Fall sein implementiert als:

List<Student> sortedCivilStudents = students.stream()
                                            .filter(student -> "土木工程".equals(student.getMajor())).sorted((s1, s2) -> s1.getAge() - s2.getAge())
                                            .limit(2)
                                            .collect(Collectors.toList());

Nach dem Login kopieren

skip
Die Skip-Operation ist das Gegenteil der Limit-Operation, sie überspringt die ersten n Elemente. Zum Beispiel möchten wir die Hauptfächer des Bauingenieurwesens nach 2. Studenten sortiert finden, dann kann es wie folgt implementiert werden:

List<Student> civilStudents = students.stream()
                                    .filter(student -> "土木工程".equals(student.getMajor()))
                                    .skip(2)
                                    .collect(Collectors.toList());

Nach dem Login kopieren

Durch Überspringen der ersten beiden Elemente werden übersprungen und der aus allen nachfolgenden Elementen erstellte Stream wird zurückgegeben. Wenn n größer als die erfüllte Bedingung ist, wird eine leere Sammlung zurückgegeben.

2.2 Zuordnung

In SQL können wir durch Hinzufügen der erforderlichen Feldnamen nach dem Schlüsselwort

SELECT

Nach dem Login kopieren

nur die Felder ausgeben, die wir benötigen Daten und die Mapping-Operation der Streaming-Verarbeitung erfüllen diesen Zweck auch. Bei der Streaming-Verarbeitung von Java8 gibt es hauptsächlich zwei Arten von Mapping-Operationen: Map und FlatMap.

Karte
Angenommen, wir möchten beispielsweise die Namen aller Studenten mit Hauptfach Informatik herausfiltern, dann können wir nach Karte basierend auf dem Filter „Studentenentität“ filtern wird einer Schülernamenzeichenfolge zugeordnet und die spezifische Implementierung ist wie folgt:

List<String> names = students.stream()
                            .filter(student -> "计算机科学".equals(student.getMajor()))
                            .map(Student::getName).collect(Collectors.toList());

Nach dem Login kopieren

除了上面这类基础的map，java8还提供了

mapToDouble(ToDoubleFunction<? super T> mapper)

Nach dem Login kopieren

，

mapToInt(ToIntFunction<? super T> mapper)

Nach dem Login kopieren

，

mapToLong(ToLongFunction<? super T> mapper)

Nach dem Login kopieren

，这些映射分别返回对应类型的流，java8为这些流设定了一些特殊的操作，比如我们希望计算所有专业为计算机科学学生的年龄之和，那么我们可以实现如下：

int totalAge = students.stream()
                    .filter(student -> "计算机科学".equals(student.getMajor()))
                    .mapToInt(Student::getAge).sum();

Nach dem Login kopieren

通过将Student按照年龄直接映射为

IntStream

Nach dem Login kopieren

，我们可以直接调用提供的

sum()

Nach dem Login kopieren

方法来达到目的，此外使用这些数值流的好处还在于可以避免jvm装箱操作所带来的性能消耗。

flatMap

flatMap与map的区别在于 flatMap是将一个流中的每个值都转成一个个流，然后再将这些流扁平化成为一个流 。举例说明，假设我们有一个字符串数组

String[] strs = {"java8", "is", "easy", "to", "use"};

Nach dem Login kopieren

，我们希望输出构成这一数组的所有非重复字符，那么我们可能首先会想到如下实现：

List<String[]> distinctStrs = Arrays.stream(strs)
                                .map(str -> str.split(""))  // 映射成为Stream<String[]>
                                .distinct()
                                .collect(Collectors.toList());

Nach dem Login kopieren

在执行map操作以后，我们得到是一个包含多个字符串（构成一个字符串的字符数组）的流，此时执行distinct操作是基于在这些字符串数组之间的对比，所以达不到我们希望的目的，此时的输出为：

[j, a, v, a, 8]
[i, s]
[e, a, s, y]
[t, o]
[u, s, e]

Nach dem Login kopieren

distinct只有对于一个包含多个字符的流进行操作才能达到我们的目的，即对

Stream<String>

Nach dem Login kopieren

进行操作。此时flatMap就可以达到我们的目的：

List distinctStrs = Arrays.stream(strs)
                                .map(str -> str.split(""))  // 映射成为Stream<String[]>
                                .flatMap(Arrays::stream)  // 扁平化为Stream<String>
                                .distinct()
                                .collect(Collectors.toList());

Nach dem Login kopieren

flatMap将由map映射得到的

Stream<String[]>

Nach dem Login kopieren

，转换成由各个字符串数组映射成的流

Stream<String>

Nach dem Login kopieren

，再将这些小的流扁平化成为一个由所有字符串构成的大流

Steam<String>

Nach dem Login kopieren

，从而能够达到我们的目的。

与map类似，flatMap也提供了针对特定类型的映射操作：

flatMapToDouble(Function<? super T,? extends DoubleStream> mapper)

Nach dem Login kopieren

，

flatMapToInt(Function<? super T,? extends IntStream> mapper)

Nach dem Login kopieren

，

flatMapToLong(Function<? super T,? extends LongStream> mapper)

Nach dem Login kopieren

。

三. 终端操作

终端操作是流式处理的最后一步，我们可以在终端操作中实现对流查找、归约等操作。

3.1 查找

allMatch

allMatch用于检测是否全部都满足指定的参数行为，如果全部满足则返回true，例如我们希望检测是否所有的学生都已满18周岁，那么可以实现为：

boolean isAdult = students.stream().allMatch(student -> student.getAge() >= 18);
anyMatch

anyMatch则是检测是否存在一个或多个满足指定的参数行为，如果满足则返回true，例如我们希望检测是否有来自武汉大学的学生，那么可以实现为：

boolean hasWhu = students.stream().anyMatch(student -> "武汉大学".equals(student.getSchool()));
noneMathch

noneMatch用于检测是否不存在满足指定行为的元素，如果不存在则返回true，例如我们希望检测是否不存在专业为计算机科学的学生，可以实现如下：

boolean noneCs = students.stream().noneMatch(student -> "计算机科学".equals(student.getMajor()));
findFirst

findFirst用于返回满足条件的第一个元素，比如我们希望选出专业为土木工程的排在第一个学生，那么可以实现如下：

Optional optStu = students.stream().filter(student -> "土木工程".equals(student.getMajor())).findFirst();
findFirst不携带参数，具体的查找条件可以通过filter设置，此外我们可以发现findFirst返回的是一个Optional类型，关于该类型的具体讲解可以参考上一篇：Java8新特性 – Optional类。

findAny

findAny相对于findFirst的区别在于，findAny不一定返回第一个，而是返回任意一个，比如我们希望返回任意一个专业为土木工程的学生，可以实现如下：

Optional optStu = students.stream().filter(student -> "土木工程".equals(student.getMajor())).findAny();
实际上对于顺序流式处理而言，findFirst和findAny返回的结果是一样的，至于为什么会这样设计，是因为在下一篇我们介绍的并行流式处理，当我们启用并行流式处理的时候，查找第一个元素往往会有很多限制，如果不是特别需求，在并行流式处理中使用findAny的性能要比findFirst好。

3.2 归约

前面的例子中我们大部分都是通过

collect(Collectors.toList())

Nach dem Login kopieren

对数据封装返回，如我的目标不是返回一个新的集合，而是希望对经过参数化操作后的集合进行进一步的运算，那么我们可用对集合实施归约操作。java8的流式处理提供了

reduce

Nach dem Login kopieren

方法来达到这一目的。

前面我们通过mapToInt将

Stream<Student>

Nach dem Login kopieren

映射成为

IntStream

Nach dem Login kopieren

，并通过

IntStream

Nach dem Login kopieren

的sum方法求得所有学生的年龄之和，实际上我们通过归约操作，也可以达到这一目的，实现如下：

// 前面例子中的方法
int totalAge = students.stream()
                .filter(student -> "计算机科学".equals(student.getMajor()))
                .mapToInt(Student::getAge).sum();
// 归约操作
int totalAge = students.stream()
                .filter(student -> "计算机科学".equals(student.getMajor()))
                .map(Student::getAge)
                .reduce(0, (a, b) -> a + b);
// 进一步简化
int totalAge2 = students.stream()
                .filter(student -> "计算机科学".equals(student.getMajor()))
                .map(Student::getAge)
                .reduce(0, Integer::sum);
// 采用无初始值的重载版本，需要注意返回Optional
Optional<Integer> totalAge = students.stream()
                .filter(student -> "计算机科学".equals(student.getMajor()))
                .map(Student::getAge)
                .reduce(Integer::sum);  // 去掉初始值

Nach dem Login kopieren

3.3 收集

前面利用

collect(Collectors.toList())

Nach dem Login kopieren

是一个简单的收集操作，是对处理结果的封装，对应的还有

toSet

Nach dem Login kopieren

、

toMap

Nach dem Login kopieren

，以满足我们对于结果组织的需求。这些方法均来自于

java.util.stream.Collectors

Nach dem Login kopieren

，我们可以称之为收集器。

3.3.1 归约

收集器也提供了相应的归约操作，但是与reduce在内部实现上是有区别的，收集器更加适用于可变容器上的归约操作，这些收集器广义上均基于

Collectors.reducing()

Nach dem Login kopieren

实现。

例1：求学生的总人数

long count = students.stream().collect(Collectors.counting());
// 进一步简化
long count = students.stream().count();

Nach dem Login kopieren

例2：求年龄的最大值和最小值

// 求最大年龄
Optional<Student> olderStudent = students.stream().collect(Collectors.maxBy((s1, s2) -> s1.getAge() - s2.getAge()));
// 进一步简化
Optional<Student> olderStudent2 = students.stream().collect(Collectors.maxBy(Comparator.comparing(Student::getAge)));
// 求最小年龄
Optional<Student> olderStudent3 = students.stream().collect(Collectors.minBy(Comparator.comparing(Student::getAge)));

Nach dem Login kopieren

例3：求年龄总和

int totalAge4 = students.stream().collect(Collectors.summingInt(Student::getAge));
对应的还有

summingLong

Nach dem Login kopieren

、

summingDouble

Nach dem Login kopieren

。

例4：求年龄的平均值

double avgAge = students.stream().collect(Collectors.averagingInt(Student::getAge));
对应的还有

averagingLong

Nach dem Login kopieren

、

averagingDouble

Nach dem Login kopieren

。

例5：一次性得到元素个数、总和、均值、最大值、最小值

IntSummaryStatistics statistics = students.stream().collect(Collectors.summarizingInt(Student::getAge));
输出：

IntSummaryStatistics{count=10, sum=220, min=20, average=22.000000, max=24}
对应的还有

summarizingLong

Nach dem Login kopieren

、

summarizingDouble

Nach dem Login kopieren

。

例6：字符串拼接

String names = students.stream().map(Student::getName).collect(Collectors.joining());
// 输出：孔明伯约玄德云长翼德元直奉孝仲谋鲁肃丁奉
String names = students.stream().map(Student::getName).collect(Collectors.joining(", "));
// 输出：孔明, 伯约, 玄德, 云长, 翼德, 元直, 奉孝, 仲谋, 鲁肃, 丁奉

3.3.2 分组

在数据库操作中，我们可以通过

GROUP BY

Nach dem Login kopieren

关键字对查询到的数据进行分组，java8的流式处理也为我们提供了这样的功能

Collectors.groupingBy

Nach dem Login kopieren

来操作集合。比如我们可以按学校对上面的学生进行分组：

Map> groups = students.stream().collect(Collectors.groupingBy(Student::getSchool));

groupingBy

Nach dem Login kopieren

接收一个分类器

Function<? super T, ? extends K> classifier

Nach dem Login kopieren

，我们可以自定义分类器来实现需要的分类效果。

上面演示的是一级分组，我们还可以定义多个分类器实现 多级分组，比如我们希望在按学校分组的基础之上再按照专业进行分组，实现如下：

Map>> groups2 = students.stream().collect(
Collectors.groupingBy(Student::getSchool, // 一级分组，按学校
Collectors.groupingBy(Student::getMajor))); // 二级分组，按专业
实际上在

groupingBy

Nach dem Login kopieren

的第二个参数不是只能传递groupingBy，还可以传递任意

Collector

Nach dem Login kopieren

类型，比如我们可以传递一个

Collector.counting

Nach dem Login kopieren

，用以统计每个组的个数：

Map groups = students.stream().collect(Collectors.groupingBy(Student::getSchool, Collectors.counting()));
如果我们不添加第二个参数，则编译器会默认帮我们添加一个

Collectors.toList()

Nach dem Login kopieren

。

3.3.3 分区

分区可以看做是分组的一种特殊情况，在分区中key只有两种情况：true或false，目的是将待分区集合按照条件一分为二，java8的流式处理利用

ollectors.partitioningBy()

Nach dem Login kopieren

方法实现分区，该方法接收一个谓词，例如我们希望将学生分为武大学生和非武大学生，那么可以实现如下：

Map> partition = students.stream().collect(Collectors.partitioningBy(student -> "武汉大学".equals(student.getSchool())));
分区相对分组的优势在于，我们可以同时得到两类结果，在一些应用场景下可以一步得到我们需要的所有结果，比如将数组分为奇数和偶数。

以上介绍的所有收集器均实现自接口

java.util.stream.Collector

Nach dem Login kopieren

，该接口的定义如下：

public interface Collector<T, A, R> {
    /**
     * A function that creates and returns a new mutable result container.
     *
     * @return a function which returns a new, mutable result container
     */
    Supplier<A> supplier();
    /**
     * A function that folds a value into a mutable result container.
     *
     * @return a function which folds a value into a mutable result container
     */
    BiConsumer<A, T> accumulator();
    /**
     * A function that accepts two partial results and merges them.  The
     * combiner function may fold state from one argument into the other and
     * return that, or may return a new result container.
     *
     * @return a function which combines two partial results into a combined
     * result
     */
    BinaryOperator<A> combiner();
    /**
     * Perform the final transformation from the intermediate accumulation type
     * {@code A} to the final result type {@code R}.
     *
     * <p>If the characteristic {@code IDENTITY_TRANSFORM} is
     * set, this function may be presumed to be an identity transform with an
     * unchecked cast from {@code A} to {@code R}.
     *
     * @return a function which transforms the intermediate result to the final
     * result
     */
    Function<A, R> finisher();
    /**
     * Returns a {@code Set} of {@code Collector.Characteristics} indicating
     * the characteristics of this Collector.  This set should be immutable.
     *
     * @return an immutable set of collector characteristics
     */
    Set<Characteristics> characteristics();
}

Nach dem Login kopieren

我们也可以实现该接口来定义自己的收集器，此处不再展开。