首页 > 后端开发 > Python教程 > 使用 Lambda 函数从 So DynamoDB 解析和加载数据

使用 Lambda 函数从 So DynamoDB 解析和加载数据

Susan Sarandon
发布: 2025-01-06 06:24:47
原创
227 人浏览过

许多场景需要您使用 JSON 格式的数据,并且您希望提取并处理数据,然后将其保存到表中以供将来使用

在本文中,我们将讨论使用 Lambda 函数将 JSON 格式的数据从 S3 存储桶加载到 DynamoDB 表

先决条件

  1. 有权将对象上传到 S3
  2. 具有 S3 和 DynamoDB 权限的 Lambda 执行角色

架构和组件

下面的架构显示我们正在使用 3 个 AWS 服务

  1. S3 存储桶
  2. Lambda 函数
  3. DynamoDB 表

Parsing & Loading Data from So DynamoDB with Lambda Function

以下服务的简要说明作为茶点:

  • S3 Bucket:具有可扩展性、安全性和高性能的对象存储服务将作为我们的数据存储服务
  • Lambda 函数:无服务器计算服务,允许您运行代码而无需担心基础设施,易于设置并支持多种编程语言,我们将利用它来运行我们的代码并部署我们的逻辑。
  • DynamoDB:无服务器 NoSQL 数据库,用于将我们的数据存储在表中,我们将使用它来存储 Lambda 函数处理后的数据

流动

  1. 用户将通过后台 PutObject API 的控制台或 CLI 将 JSON 文件上传到 S3 存储桶
  2. 对象上传成功,将触发S3事件调用lambda函数来加载和处理文件
  3. Lambda 将处理数据并将其加载到 DynamoDB 表

实施步骤

我们将逐步完成部署上图的步骤和配置

1-使用以下配置创建 Lambda 函数

从头开始的作者
函数名称:ParserDemo
运行时:Python 3.1x

其余保留默认
创建 Lambda 后,您需要修改超时配置和执行角色,如下所示:

Parsing & Loading Data from So DynamoDB with Lambda Function

Parsing & Loading Data from So DynamoDB with Lambda Function

我编写了这个Python代码来执行逻辑

import json
import boto3

s3_client = boto3.client('s3')
dynamodb = boto3.resource('dynamodb')

def lambda_handler(event, context):



    bucket_name = event['Records'][0]['s3']['bucket']['name'] # Getting the bucket name from the event triggered by S3
    object_key = event['Records'][0]['s3']['object']['key'] # Getting the Key of the item when the data is uploaded to S3
    print(f"Bucket: {bucket_name}, Key: {object_key}")


    response = s3_client.get_object(
    Bucket=bucket_name,
    Key=object_key
)


    # We will convert the streamed data into bytes
    json_data = response['Body'].read()
    string_formatted = json_data.decode('UTF-8') #Converting data into string

    dict_format_data = json.loads(string_formatted) #Converting Data into Dictionary 


    # Inserting Data Into DynamoDB

    table = dynamodb.Table('DemoTable')
    if isinstance(dict_format_data, list): #check if the file contains single record
        for record in dict_format_data:
            table.put_item(Item=record)

    elif isinstance(dict_format_data, dict): # check if the file contains multiple records 
        table.put_item(Item=data)

    else:  
        raise ValueError("Not Supported Format") # Raise error if nothing matched

登录后复制

2- 创建 S3 存储桶

BucketName:使用唯一的名称

将其余配置保留为默认值

将创建的 S3 存储桶作为触发器添加到 lambda 函数,如下所示:

Parsing & Loading Data from So DynamoDB with Lambda Function

Parsing & Loading Data from So DynamoDB with Lambda Function

3- 使用以下配置在 DynamoDB 中创建表

表名称:DemoTable
分区键:UserId
桌子设置:定制
容量模式:已配置

为了节省成本,将预配置容量单位配置为低值读/写(1 或 2 个单位)

Parsing & Loading Data from So DynamoDB with Lambda Function

Parsing & Loading Data from So DynamoDB with Lambda Function

现在设置已准备就绪,您可以通过将文件上传到 S3 来测试它,然后您将找到在 DynamoDB 表上创建的项目以及您上传到文件中的记录。

Lambda 函数的 CloudWatch Logs

Parsing & Loading Data from So DynamoDB with Lambda Function

DynamoDB 项目

Parsing & Loading Data from So DynamoDB with Lambda Function

我希望您觉得这很有趣,如果您有任何意见,请告诉我。

参考

S3 API
DynamoDB API
AWS 服务的 boto3 实践

以上是使用 Lambda 函数从 So DynamoDB 解析和加载数据的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:dev.to
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板