Spark入门指南：从基础概念到实践应用全解析(13) _Spark

Structured Streaming 同样支持 DSL 和 SQL 语法。
DSL 语法：
import org.apache.spark.sql.SparkSessionval spark = SparkSession.builder.appName("Structured Streaming Example").getOrCreate()val lines = spark.readStream.format("socket").option("host", "localhost").option("port", 9999).load()import spark.implicits._val words = lines.as[String].flatMap(_.split(" "))val wordCounts = words.groupBy("value").count()val query = wordCounts.writeStream.outputMode("complete").format("console").start()query.awaitTermination()SQL 语法：
import org.apache.spark.sql.SparkSessionval spark = SparkSession.builder.appName("Structured Streaming Example").getOrCreate()val lines = spark.readStream.format("socket").option("host", "localhost").option("port", 9999).load()lines.createOrReplaceTempView("lines")val wordCounts = spark.sql("""|SELECT value, COUNT(*) as count|FROM (|SELECT explode(split(value, ' ')) as value|FROM lines|)|GROUP BY value""".stripMargin)val query = wordCounts.writeStream.outputMode("complete").format("console").start()query.awaitTermination()1.SourceStructured Streaming 支持多种输入源，包括文件源（如文本文件、Parquet 文件、JSON 文件等）、Kafka、Socket 等。下面是一个使用 Scala 语言从 Kafka 中读取数据的例子：
import org.apache.spark.sql.SparkSessionval spark = SparkSession.builder.appName("StructuredStreaming").getOrCreate()// 订阅一个主题val df = spark.readStream.format("kafka").option("kafka.bootstrap.servers", "host1:port1,host2:port2").option("subscribe", "topic1").load()df.selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)").as[(String, String)]2.OutputStructured Streaming 支持多种输出方式，包括控制台输出、内存输出、文件输出、数据源输出等。下面是将数据写入到 Parquet 文件中的例子：
import org.apache.spark.sql.SparkSessionval spark = SparkSession.builder.appName("StructuredStreaming").getOrCreate()// 从 socket 中读取数据val lines = spark.readStream.format("socket").option("host", "localhost").option("port", 9999).load()// 将数据写入到 Parquet 文件中lines.writeStream.format("parquet").option("path", "path/to/output/dir").option("checkpointLocation", "path/to/checkpoint/dir").start()3.Output Mode每当结果表更新时，我们都希望将更改后的结果行写入外部接收器。
Output mode 指定了数据写入输出接收器的方式。Structured Streaming 支持以下三种 output mode：
Output Mode
描述
Append
只将流 DataFrame/Dataset 中的新行写入接收器。
Complete
每当有更新时，将流 DataFrame/Dataset 中的所有行写入接收器。
Update
每当有更新时，只将流 DataFrame/Dataset 中更新的行写入接收器。
4.Output SinkOutput sink 指定了数据写入的位置。Structured Streaming 支持多种输出接收器，包括文件接收器、Kafka 接收器、Foreach 接收器、控制台接收器和内存接收器等。下面是一些使用 Scala 语言将数据写入到不同输出接收器中的例子：
import org.apache.spark.sql.SparkSessionval spark = SparkSession.builder.appName("StructuredStreaming").getOrCreate()// 从 socket 中读取数据val lines = spark.readStream.format("socket").option("host", "localhost").option("port", 9999).load()// 将数据写入到 Parquet 文件中lines.writeStream.format("parquet").option("path", "path/to/output/dir").option("checkpointLocation", "path/to/checkpoint/dir").start()// 将数据写入到 Kafka 中//selectExpr 是一个 DataFrame 的转换操作，它允许你使用 SQL 表达式来选择 DataFrame 中的列。//selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)") 表示选择 key 和 value 列，并将它们的类型转换为字符串类型。//这是因为 Kafka 接收器要求数据必须是字符串类型或二进制类型。lines.selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)").writeStream.format("kafka").option("kafka.bootstrap.servers", "host1:port1,host2:port2").option("topic", "topic1").start()// 将数据写入到控制台中lines.writeStream.format("console").start()// 将数据写入到内存中lines.writeStream.format("memory").queryName("tableName").start()


上一页
9
10
11
12
13
14
下一页
		  	





























推荐阅读

           
                  
              
                  「陈法蓉」陈法蓉奔六年纪有少女心，衣服上带荷叶花边，短发也能穿出女人味 
                
                   
                
              
            

                  
              
                  旅途结束返程的诗句?旅游返程的唯美句子 
                
                   
                
              
            

                  
              
                  幽默搞笑段子集锦|幽默笑话：男友在我脖子上留了个吻痕，回家被老妈发现了！，原创 
                
                   
                
              
            

                  
              
                  上海浦东报告1例确诊病例：浦东机场货运站从事搬运工作 已追踪密接者26人 
                
                   
                
              
            

                  
              
                  内心忐忑的小时|朱一龙为杨蓉庆生，延续6年的祝福太暖心，祝你做自己的光，原创 
                
                   
                
              
            

                  
              
                   补肾|肾虚“别忙补”，老中医：“3招”补肾气，简单易学！ 
                
                   
                
              
            

                  
              
                  『澳大利亚』澳称鉴于印太地区形势变化将采购远程导弹，中方表态 
                
                   
                
              
            

                  
              
                  华炬名茶携手知名酒庄演绎茶酒文化 
                
                   
                
              
            

                  
              
                  《武学宗师》启巡演：以中国式话剧展近代武学名家之魂 
                
                   
                
              
            

                  
              
                   健康|十个女的九个有炎症，坚持吃一物，杀菌消炎，子宫越来越健康 
                
                   
                
              
            

                  
              
                  天冷了，吃牛肉不如吃它，上锅蒸一蒸，清香鲜美，冬天的佳肴 
                
                   
                
              
            

                  
              
                  「国民党」此人是国民党少校，却指挥得动少将，建国后在刑场上被解放军救下 
                
                   
                
              
            

                  
              
                  喝红茶的点心,广州茶的特点 
                
                   
                
              
            

                  
              
                  科技创新▲中国天量的货币应该流向哪里？ 
                
                   
                
              
            

                  
              
                  [牛仔裤]牛仔裤修饰身形的效果非常的好，简约而又不失淑女的时尚气质 
                
                   
                
              
            

                  
              
                  百家讲坛讲哪几集可以帮助高中的学习 
                
                   
                
              
            

                  
              
                  哈萨克斯坦明日直播总统大选电视辩论，7名候选人将一逞辩才 
                
                   
                
              
            

                  
              
                  冷天早餐，不糊弄不将就，学学7天不重样，孩子吃得好精神也充足 
                
                   
                
              
            

                  
              
                  蓓小西|从打扮中就看得出，谁的野心比较大，范冰冰、马苏同框高调看秀 
                
                   
                
              
            

                  
              
                  买鲈鱼时，要分清“河鲈”和“海鲈”，区别挺大，弄懂再买不吃亏 
                
                   
                
              
            

          

烤箱新手教程 烤箱入门窍门 

指南针的作用和意义 指南针的作用意义是什么 

精致女生减肥指南，20个习惯，做到一半，就能再瘦70年 

微波炉怎么选购指南视频 微波炉怎么选购指南 

指南针怎么看 指南针怎么看海拔 

抖音产业带服务商入驻详细指南！ 

春节社交礼仪 春节社交礼仪指南 

中国早期的指南针也被称为什么?A 中国早期的指南针也被称为什么 

Tomcat目录结构详解：从新手到专家的指南 

“十一”长假哪天最堵？这份“避堵”指南请收好