使用 Lambda 函数从 So DynamoDB 解析和加载数据
许多场景需要您使用 JSON 格式的数据,并且您希望提取并处理数据,然后将其保存到表中以供将来使用
在本文中,我们将讨论使用 Lambda 函数将 JSON 格式的数据从 S3 存储桶加载到 DynamoDB 表
先决条件
- 有权将对象上传到 S3
- 具有 S3 和 DynamoDB 权限的 Lambda 执行角色
架构和组件
下面的架构显示我们正在使用 3 个 AWS 服务
- S3 存储桶
- Lambda 函数
- DynamoDB 表
以下服务的简要说明作为茶点:
- S3 Bucket:具有可扩展性、安全性和高性能的对象存储服务将作为我们的数据存储服务
- Lambda 函数:无服务器计算服务,允许您运行代码而无需担心基础设施,易于设置并支持多种编程语言,我们将利用它来运行我们的代码并部署我们的逻辑。
- DynamoDB:无服务器 NoSQL 数据库,用于将我们的数据存储在表中,我们将使用它来存储 Lambda 函数处理后的数据
流动
- 用户将通过后台 PutObject API 的控制台或 CLI 将 JSON 文件上传到 S3 存储桶
- 对象上传成功,将触发S3事件调用lambda函数来加载和处理文件
- Lambda 将处理数据并将其加载到 DynamoDB 表
实施步骤
我们将逐步完成部署上图的步骤和配置
1-使用以下配置创建 Lambda 函数
从头开始的作者
函数名称:ParserDemo
运行时:Python 3.1x
其余保留默认
创建 Lambda 后,您需要修改超时配置和执行角色,如下所示:
我编写了这个Python代码来执行逻辑
import json import boto3 s3_client = boto3.client('s3') dynamodb = boto3.resource('dynamodb') def lambda_handler(event, context): bucket_name = event['Records'][0]['s3']['bucket']['name'] # Getting the bucket name from the event triggered by S3 object_key = event['Records'][0]['s3']['object']['key'] # Getting the Key of the item when the data is uploaded to S3 print(f"Bucket: {bucket_name}, Key: {object_key}") response = s3_client.get_object( Bucket=bucket_name, Key=object_key ) # We will convert the streamed data into bytes json_data = response['Body'].read() string_formatted = json_data.decode('UTF-8') #Converting data into string dict_format_data = json.loads(string_formatted) #Converting Data into Dictionary # Inserting Data Into DynamoDB table = dynamodb.Table('DemoTable') if isinstance(dict_format_data, list): #check if the file contains single record for record in dict_format_data: table.put_item(Item=record) elif isinstance(dict_format_data, dict): # check if the file contains multiple records table.put_item(Item=data) else: raise ValueError("Not Supported Format") # Raise error if nothing matched
2- 创建 S3 存储桶
BucketName:使用唯一的名称
将其余配置保留为默认值
将创建的 S3 存储桶作为触发器添加到 lambda 函数,如下所示:
3- 使用以下配置在 DynamoDB 中创建表
表名称:DemoTable
分区键:UserId
桌子设置:定制
容量模式:已配置
为了节省成本,将预配置容量单位配置为低值读/写(1 或 2 个单位)
现在设置已准备就绪,您可以通过将文件上传到 S3 来测试它,然后您将找到在 DynamoDB 表上创建的项目以及您上传到文件中的记录。
Lambda 函数的 CloudWatch Logs
DynamoDB 项目
我希望您觉得这很有趣,如果您有任何意见,请告诉我。
参考
S3 API
DynamoDB API
AWS 服务的 boto3 实践
以上是使用 Lambda 函数从 So DynamoDB 解析和加载数据的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。 Python以简洁和强大的生态系统着称,C 则以高性能和底层控制能力闻名。

两小时内可以学到Python的基础知识。1.学习变量和数据类型,2.掌握控制结构如if语句和循环,3.了解函数的定义和使用。这些将帮助你开始编写简单的Python程序。

Python在游戏和GUI开发中表现出色。1)游戏开发使用Pygame,提供绘图、音频等功能,适合创建2D游戏。2)GUI开发可选择Tkinter或PyQt,Tkinter简单易用,PyQt功能丰富,适合专业开发。

2小时内可以学会Python的基本编程概念和技能。1.学习变量和数据类型,2.掌握控制流(条件语句和循环),3.理解函数的定义和使用,4.通过简单示例和代码片段快速上手Python编程。

Python更易学且易用,C 则更强大但复杂。1.Python语法简洁,适合初学者,动态类型和自动内存管理使其易用,但可能导致运行时错误。2.C 提供低级控制和高级特性,适合高性能应用,但学习门槛高,需手动管理内存和类型安全。

Python在web开发、数据科学、机器学习、自动化和脚本编写等领域有广泛应用。1)在web开发中,Django和Flask框架简化了开发过程。2)数据科学和机器学习领域,NumPy、Pandas、Scikit-learn和TensorFlow库提供了强大支持。3)自动化和脚本编写方面,Python适用于自动化测试和系统管理等任务。

要在有限的时间内最大化学习Python的效率,可以使用Python的datetime、time和schedule模块。1.datetime模块用于记录和规划学习时间。2.time模块帮助设置学习和休息时间。3.schedule模块自动化安排每周学习任务。

Python因其简洁与强大而备受青睐,适用于从初学者到高级开发者的各种需求。其多功能性体现在:1)易学易用,语法简单;2)丰富的库和框架,如NumPy、Pandas等;3)跨平台支持,可在多种操作系统上运行;4)适合脚本和自动化任务,提升工作效率。
