TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?-JS 튜토리얼-php.cn

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

이 기사에서는 TensorFlow.js를 사용하여 기본 AI 모델을 만들고 더 복잡한 모델을 사용하여 몇 가지 흥미로운 기능을 구현하는 방법을 살펴봅니다. 이제 막 인공지능을 접하기 시작했습니다. 인공지능에 대한 깊은 지식이 필요하지는 않지만, 아직 몇 가지 개념을 이해해야 합니다.

모델이란 무엇인가요?

실제 세계는 매우 복잡합니다. 이해하려면 단순화해야 합니다. 모델을 통해 단순화할 수 있습니다. 세계 지도, 차트 등이 있습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

예를 들어 주택 임대 가격과 주택 면적 사이의 관계를 표현하는 모델을 구축하려면 먼저 다음과 같은 몇 가지 데이터를 수집해야 합니다.

방 수	price
3	131000
3	125000
4	235000
4	265000
5	535000

그런 다음 각 매개변수(가격, 방 수)를 1차원으로 취하여 이 데이터를 2차원 그래프에 표시합니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

그런 다음 선을 그려 더 많은 방 가격으로 주택 임대를 예측할 수 있습니다. 이 모델을 선형 회귀라고 하며 기계 학습에서 가장 간단한 모델 중 하나입니다. 하지만 이 모델은 충분하지 않습니다.

데이터가 5개뿐이므로 충분히 신뢰할 수 없습니다.
2가지 매개변수(가격, 객실)만 있지만 가격에 영향을 미칠 수 있는 더 많은 요소(예: 면적, 장식 등)가 있습니다.

첫 번째 문제는 백만 개 정도의 데이터를 더 추가하면 해결될 수 있습니다. 두 번째 질문에는 더 많은 차원을 추가할 수 있습니다. 2차원 차트에서는 데이터를 이해하고 선을 그리는 것이 쉽고, 3차원 차트에서는 평면을 사용할 수 있습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

그러나 데이터의 차원이 3, 4 또는 심지어 1,000,000 차원인 경우 , 뇌는 차트를 읽을 방법이 없습니다. 위에서 시각화할 수 있지만 차원이 3을 초과하면 초평면을 수학적으로 계산할 수 있으며 이 문제를 해결하기 위해 신경망이 탄생했습니다.

신경망이란 무엇인가요?

신경망이 무엇인지 이해하려면 뉴런이 무엇인지 알아야 합니다. 실제 뉴런은 다음과 같습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

뉴런은 다음 부분으로 구성됩니다.

Dendrites: 이는 데이터의 입력 끝입니다.
Axon: 출력 끝입니다.
Synapse(다이어그램에는 표시되지 않음): 이 구조는 하나의 뉴런과 다른 뉴런 사이의 통신을 허용합니다. 축삭의 신경 말단과 인근 뉴런의 수상돌기 사이에서 전기 신호를 전달하는 역할을 담당합니다. 이러한 시냅스는 사용법에 따라 전기적 활동을 증가시키거나 감소시키기 때문에 학습에 핵심입니다.

기계 학습의 뉴런(간소화):

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

입력(입력) : 입력 매개변수.
Weights: 시냅스와 마찬가지로 뉴런을 조정하여 선형 회귀를 더 잘 설정하는 데 사용됩니다.
선형 함수: 각 뉴런은 선형 회귀 함수와 같습니다. 선형 회귀 모델의 경우 뉴런 하나만 있으면 충분합니다.
활성화 함수: 일부 활성화 함수는 스칼라 출력을 다른 비선형 함수로 변경하는 데 사용할 수 있습니다. 일반적인 것들은 Sigmoid, RELU 및 tanh입니다.
Output: 활성화 함수를 적용한 후 계산된 출력입니다.

활성화 기능은 매우 유용하며 신경망의 힘은 주로 여기에 기인합니다. 활성화 기능이 없으면 지능형 뉴런 네트워크를 얻는 것이 불가능합니다. 신경망에 여러 개의 뉴런이 있더라도 신경망의 출력은 항상 선형 회귀이기 때문입니다. 따라서 비선형 문제를 해결하려면 각 선형 회귀를 비선형 회귀로 변환하는 메커니즘이 필요합니다. 이러한 선형 함수는 활성화 함수를 통해 비선형 함수로 변환될 수 있습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

모델 교육

2D 선형 회귀 예제에서 설명한 대로 그래프에 선을 그려 새 데이터를 예측하면 됩니다. 그럼에도 불구하고 "딥 러닝"의 아이디어는 우리의 신경망이 이 선을 그리는 방법을 배우게 하는 것입니다. 단순한 선의 경우 뉴런이 하나만 있는 매우 간단한 신경망을 사용할 수 있지만, 두 개의 데이터 세트를 분류하는 등 더 복잡한 작업을 수행하려는 모델의 경우 네트워크를 "훈련"해야 합니다. 다음 :

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

2D이기 때문에 과정이 복잡하지 않습니다. 각 모델은 세계를 설명하는 데 사용되지만 "훈련"의 개념은 모든 모델에서 매우 유사합니다. 첫 번째 단계는 임의의 선을 그리고 알고리즘에서 이를 반복적으로 개선하여 각 반복 중에 프로세스의 오류를 수정하는 것입니다. 이 최적화 알고리즘을 경사하강법(Gradient Descent)이라고 합니다(동일한 개념을 가진 알고리즘은 SGD나 ADAM 등에서도 더 복잡합니다). 각 알고리즘(선형회귀, 대수회귀 등)은 오차를 측정하는 비용함수가 다르며, 비용함수는 항상 특정 지점으로 수렴하게 됩니다. 볼록하거나 오목할 수 있지만 결국 오류가 0%인 점으로 수렴됩니다. 우리의 목표는 이것을 달성하는 것입니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

경사하강법 알고리즘을 사용하면 비용 함수의 임의의 지점에서 시작하지만 그것이 어디에 있는지 정확히 알 수 없습니다! 눈을 가린 채 산에 던져지는 것과 같습니다. 산을 내려가려면 한걸음씩 가장 낮은 곳으로 가야 합니다. 지형이 불규칙한 경우(예: 오목한 기능) 하강이 더 복잡해집니다.

여기에서는 '경사하강법' 알고리즘에 대해 자세히 설명하지 않겠습니다. 이는 AI 모델 학습 시 예측 오류를 최소화하기 위한 최적화 알고리즘이라는 점만 기억하시면 됩니다. 이 알고리즘은 행렬 곱셈에 많은 시간과 GPU가 필요합니다. 일반적으로 첫 번째 실행 시 이 수렴점에 도달하기 어렵기 때문에 학습률이나 정규화 추가와 같은 일부 하이퍼파라미터를 수정해야 합니다. 경사하강법 반복 후 오류가 0%에 가까워지면 수렴점에 접근합니다. 이를 통해 예측에 사용할 수 있는 모델이 생성됩니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

TensorFlow.js를 사용한 모델 학습

TensorFlow.js는 신경망을 생성하는 쉬운 방법을 제공합니다. 먼저 trainModel 方法创建一个 LinearModel 类。我们将使用顺序模型。顺序模型是其中一层的输出是下一层的输入的模型，即当模型拓扑是简单的层级结构，没有分支或跳过。在 trainModel 방법 내에서 레이어를 정의합니다(선형 회귀 문제를 해결하는 데 충분하므로 하나의 레이어만 사용합니다).

import * as tf from '@tensorflow/tfjs';

/**
* 线性模型类
*/
export default class LinearModel {
  /**
 * 训练模型
 */
  async trainModel(xs, ys){
    const layers = tf.layers.dense({
      units: 1, // 输出空间的纬度
      inputShape: [1], // 只有一个参数
    });
    const lossAndOptimizer = {
      loss: 'meanSquaredError',
      optimizer: 'sgd', // 随机梯度下降
    };

    this.linearModel = tf.sequential();
    this.linearModel.add(layers); // 添加一层
    this.linearModel.compile(lossAndOptimizer);

    // 开始模型训练
    await this.linearModel.fit(
      tf.tensor1d(xs),
      tf.tensor1d(ys),
    );
  }

  //...
}

로그인 후 복사

학습에 이 클래스 사용:

const model = new LinearModel()

// xs 与 ys 是 数组成员(x-axis 与 y-axis)
await model.trainModel(xs, ys)

로그인 후 복사

학습 후에 예측을 시작할 수 있습니다.

TensorFlow.js를 사용한 예측

모델을 훈련할 때 일부 하이퍼파라미터를 미리 정의해야 하지만 일반적인 예측은 여전히 쉽습니다. 다음 코드를 전달하면 충분합니다.

import * as tf from '@tensorflow/tfjs';

export default class LinearModel {
  ... //前面训练模型的代码

  predict(value){
    return Array.from(
      this.linearModel
      .predict(tf.tensor2d([value], [1, 1]))
      .dataSync()
    )
  }
}

로그인 후 복사

이제 다음을 예측할 수 있습니다.

const prediction = model.predict(500) // 预测数字 500
console.log(prediction) // => 420.423

로그인 후 복사

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

TensorFlow.js에서 사전 훈련된 모델 사용

모델 훈련이 가장 어려운 부분입니다. 첫째, 훈련을 위해 데이터가 표준화되고 모든 하이퍼파라미터가 올바르게 설정되어야 합니다. 초보자의 경우 사전 훈련된 모델을 직접 사용할 수 있습니다. TensorFlow.js는 사전 학습된 다양한 모델을 사용할 수 있으며 TensorFlow 또는 Keras로 생성된 외부 모델을 가져올 수도 있습니다. 예를 들어,posenet 모델(실시간 인간 자세 평가)을 직접 사용하여 몇 가지 흥미로운 프로젝트를 수행할 수 있습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

이 데모의 코드: https://github.com/aralroca/posenet-d3

사용하기 매우 쉽습니다:

import * as posenet from '@tensorflow-models/posenet'

// 设置一些常数
const imageScaleFactor = 0.5
const outputStride = 16
const flipHorizontal = true
const weight = 0.5

// 加载模型
const net = await posenet.load(weight)

// 进行预测
const poses = await net.estimateSinglePose(
  imageElement,
  imageScaleFactor,
  flipHorizontal,
  outputStride
)

로그인 후 복사

이 JSON은 pose 변수입니다:

{
  "score": 0.32371445304906,
  "keypoints": [
    {
      "position": {
        "y": 76.291801452637,
        "x": 253.36747741699
      },
      "part": "nose",
      "score": 0.99539834260941
    },
    {
      "position": {
        "y": 71.10383605957,
        "x": 253.54365539551
      },
      "part": "leftEye",
      "score": 0.98781454563141
    }
    // 后面还有: rightEye, leftEar, rightEar, leftShoulder, rightShoulder
    // leftElbow, rightElbow, leftWrist, rightWrist, leftHip, rightHip,
    // leftKnee, rightKnee, leftAnkle, rightAnkle...
  ]
}

로그인 후 복사

공식 데모에서 볼 수 있듯이 이 모델을 사용하여 많은 흥미로운 프로젝트를 개발할 수 있습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

이 프로젝트의 소스 코드: https://github.com/aralroca/fishFollow-posenet-tfjs

Keras 모델 가져오기

외부 모델을 TensorFlow.js로 가져올 수 있습니다. 아래는 Keras 모델(h5 형식)을 이용한 숫자 인식 프로그램입니다. 먼저 tfjs_converter를 사용하여 모델 형식을 변환합니다.

pip install tensorflowjs

로그인 후 복사

변환기 사용:

tensorflowjs_converter --input_format keras keras/cnn.h5 src/assets

로그인 후 복사

마지막으로 모델을 JS 코드로 가져옵니다.

// 载入模型
const model = await tf.loadModel('./assets/model.json')

// 准备图片
let img = tf.fromPixels(imageData, 1)
img = img.reshape([1, 28, 28, 1])
img = tf.cast(img, 'float32')

// 进行预测
const output = model.predict(img)

로그인 후 복사

코드 몇 줄만 있으면 작업이 완료됩니다. 물론 더 많은 기능을 달성하기 위해 코드에 더 많은 로직을 추가할 수 있습니다. 예를 들어 캔버스에 숫자를 쓴 다음 예측을 위한 이미지를 가져올 수 있습니다.

TensorFlow.js를 사용하여 기본 AI 모델을 만드는 방법은 무엇입니까?

이 프로젝트의 소스 코드: https://github.com/aralroca/MNIST_React_TensorFlowJS

왜 브라우저에서 사용해야 하나요?

기기가 다르기 때문에 브라우저에서 모델을 훈련할 때 효율성이 매우 낮을 수 있습니다. TensorFlow.js를 사용하여 WebGL을 사용하여 백그라운드에서 모델을 학습시키는 것은 Python 버전의 TensorFlow를 사용하는 것보다 1.5~2배 느립니다.

하지만 TensorFlow.js가 등장하기 전에는 브라우저에서 머신러닝 모델을 직접 사용할 수 있는 API가 없었습니다. 이제 브라우저 애플리케이션에서 오프라인으로 모델을 훈련하고 사용할 수 있습니다. 그리고 서버에 대한 요청이 없기 때문에 예측이 더 빠릅니다. 또 다른 이점은 이러한 모든 계산이 클라이언트 측에서 수행되므로 비용이 저렴하다는 것입니다.