OpenCV.js简介

OpenCV

OpenCV由Gary Bradski于1999年在英特尔创建。第一个版本于 2000 年发布。Vadim Pisarevsky加入Gary Bradski，管理英特尔的俄罗斯软件OpenCV团队。2005年，OpenCV被用于斯坦利;赢得2005年DARPA大挑战赛的车辆。后来，在Willow Garage的支持下，它继续积极发展，由Gary Bradski和Vadim Pisarevsky领导该项目。OpenCV现在支持与计算机视觉和机器学习相关的多种算法，并且每天都在扩展。

OpenCV支持多种编程语言，如C++，Python和Java，并且可以在不同的平台上使用，包括Windows，Linux，OS X，Android和iOS。基于 CUDA 和 OpenCL 的高速 GPU 操作接口也在积极开发中。OpenCV.js将OpenCV带到了开放的Web平台，并将其提供给JavaScript程序员。

OpenCV.js：JavaScript程序员的OpenCV

Web是最普遍的开放计算平台。随着每个浏览器中实施HTML5标准，Web应用程序能够使用HTML5视频标签呈现在线视频，通过WebRTC API捕获网络摄像头视频，并通过画布API访问视频帧的每个像素。随着大量可用的多媒体内容，Web 开发人员需要 JavaScript 中的各种图像和视觉处理算法来构建创新应用程序。对于Web上的新兴应用程序，例如Web虚拟现实（WebVR）和增强现实（WebAR），这一要求更为重要。所有这些用例都需要在 Web 上高效实现计算密集型视觉内核。

Emscripten是一个LLVM-to-JavaScript编译器。它采用LLVM位码 - 可以使用clang从C / C++生成，并将其编译为asm.js或可以直接在Web浏览器中执行的WebAssembly。.Asm.js 是 JavaScript 的一个高度可优化的低级子集。Asm.js 在 JavaScript 引擎中支持提前编译和优化，提供接近本机的执行速度。WebAssembly是一种新的可移植，大小和加载时间高效的二进制格式，适合编译到Web。WebAssembly旨在以本机速度执行。WebAssembly目前被W3C设计为开放标准。

OpenCV.js 是 Web 平台的选定 OpenCV 函数子集的 JavaScript 绑定。它允许具有多媒体处理功能的新兴Web应用程序从OpenCV中提供的各种视觉功能中受益。OpenCV.js利用Emscripten将OpenCV函数编译为asm.js或WebAssembly目标，并为Web应用程序提供JavaScript API来访问它们。该库的未来版本将利用 Web 上提供的加速 API，例如 SIMD 和多线程执行。

OpenCV.js最初是在加州大学欧文分校（UCI）的并行架构和系统组创建的，是一个由英特尔公司资助的研究项目。OpenCV.js 得到了进一步改进，并作为 Google Summer of Code 2017 计划的一部分集成到 OpenCV 项目中。

OpenCV.js教程

OpenCV引入了一组新的教程，这些教程将指导您完成OpenCV.js中可用的各种功能。本指南主要关注OpenCV 3.x版本。

OpenCV.js教程的目的是：

帮助 OpenCV 在 Web 开发中的适应性帮助 Web 社区、开发人员和计算机视觉研究人员以交互方式访问各种基于 Web 的 OpenCV 示例，以帮助他们了解特定的视觉算法。由于OpenCV.js能够直接在浏览器中运行，因此OpenCV.js教程网页具有直观性和交互性。例如，使用WebRTC API和评估JavaScript代码将允许开发人员更改CV函数的参数，并在网页上进行实时CV编码以实时查看结果。

建议先了解 JavaScript 和 Web 应用程序开发，以便理解本指南。

贡献

以下是OpenCV.js绑定和教程的贡献者列表。

Sajjad Taheri（初始版本的架构师和GSoC导师，加州大学欧文分校）潘聪祥（上海交通大学GSoC学生）宋刚（上海交通大学GSoC学生）甘文耀（上海交通大学实习生） Mohammad Reza Haghighat（英特尔公司项目发起人和赞助商）胡宁新（英特尔公司学生导师）

使用OpenCV.js

下载OpenCV.js

在本教程中，您将学习如何在网页中开始使用OpenCV.js。您可以在每个版本中获取副本，或者只需从 https://docs.opencv.org/{版本号}/opencv.js（例如：https://docs.opencv.org/3.4.0/opencv.js，如果需要最新版本，请使用）。您还可以按照教程构建 OpenCV.js 构建自己的副本。opencv.jsopencv.jsopencv-{版本号}-docs.zip3.4

第一步：创建网页

首先，让我们创建一个能够上传图像的简单网页。

<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>Hello OpenCV.js</title>
</head>
<body>
<h2>Hello OpenCV.js</h2>
<div>
  <div class="inputoutput">
    <img id="imageSrc" alt="No Image" />
    <div class="caption">imageSrc <input type="file" id="fileInput" name="file" /></div>
  </div>
</div>
<script type="text/javascript">
let imgElement = document.getElementById("imageSrc")
let inputElement = document.getElementById("fileInput");
inputElement.addEventListener("change", (e) => {
  imgElement.src = URL.createObjectURL(e.target.files[0]);
}, false);
</script>
</body>
</html>

要运行此网页，请复制上述内容并保存到index.html文件。请使用 Web 浏览器打开即可运行。

示例：

更好的做法是使用本地 Web 服务器来托管index.html

同步加载示例：

您可能希望在 <script> 标记中按属性异步加载。要在准备就绪时收到通知，您可以注册对属性的回调。opencv.js async opencv.js onload

异步加载示例

第二步：使用OpenCV.js

准备就绪后，您可以通过对象访问 OpenCV 对象和函数。opencv.js``cv

例如，您可以通过 cv.imread 从图像创建 cv.Mat。

由于图像加载是异步的，因此您需要将 cv.Mat 创建放在回调中。onload

imgElement.onload = function（） {
    let mat = cv.imread(mgElement);
}

许多OpenCV函数可用于处理cv.Mat。有关详细信息，您可以参考其他教程，例如图像处理。

在本教程中，我们只在屏幕上显示一个 cv.Mat。要显示 cv.Mat，您需要一个 canvas 元素。

<canvas id=“outputCanvas”></canvas>

您可以使用 cv.imshow 在画布上显示 cv.Mat。

cv.imshow("outputCanvas", mat);

将所有步骤放在一起，最终index.html如下所示:


<!DOCTYPE html>
<html>

<head>
    <meta charset="utf-8">
    <title>Hello OpenCV.js</title>
</head>

<body>
    <h2>Hello OpenCV.js</h2>
    <p id="status">OpenCV.js is loading...</p>
    <div>
        <div class="inputoutput">
            <img id="imageSrc" alt="No Image" />
            <div class="caption">imageSrc <input type="file" id="fileInput" name="file" /></div>
        </div>
        <div class="inputoutput">
            <canvas id="canvasOutput"></canvas>
            <div class="caption">canvasOutput</div>
        </div>
    </div>
    <script type="text/javascript">
        let imgElement = document.getElementById('imageSrc');
        let inputElement = document.getElementById('fileInput');
        inputElement.addEventListener('change', (e) => {
            imgElement.src = URL.createObjectURL(e.target.files[0]);
        }, false);
        imgElement.onload = function () {
            let mat = cv.imread(imgElement);
            cv.imshow('canvasOutput', mat);
            mat.delete();
        };
        var Module = {
            onRuntimeInitialized() {
                document.getElementById('status').innerHTML = 'OpenCV.js is ready.';
            }
        };
    </script>
    <script async src="https://docs.opencv.org/3.4.0/opencv.js" type="text/javascript"></script>
</body>

</html

你必须调用cv.Mat的删除方法来释放Emscripten堆中分配的内存。有关详细信息，请参阅 Emscripten 的内存管理。

图形用户界面功能

在这里，您将学习如何读取和显示图像和视频，并创建跟踪栏。

图像入门

学习加载图像并将其显示在 Web 中

OpenCV.js将图像保存为cv.Mat类型。我们使用HTML画布元素将cv.Mat传输到Web或反向传输。ImageData 接口可以表示或设置画布元素区域的基础像素数据。

首先，从画布创建一个图像数据对象

let canvas = document.getElementById(canvasInputId);
let ctx = canvas.getContext('2d');
let imgData = ctx.getImageData(0， 0， canvas.width， canvas.height);

然后，使用 cv.matFromImageData 构造一个 cv.Mat：

let src = cv.matFromImageData(imgData);

由于画布仅支持具有连续存储的 8 位 RGBA 图像，因此 cv.Mat 类型为 cv.CV_8UC4。它与本机 OpenCV 不同，因为由本机 imread 和 imshow 返回和显示的图像具有按 BGR 顺序存储的通道。

显示图像

首先，将 src 的类型转换为 cv.CV_8UC4：

let dst = new cv.Mat();
//比例和移位用于将数据映射到 [0,255]。
src.convertTo（dst, cv.CV_8U, scale,shift）;
//根据 src.channels（） 是 GRAY、RGB 或 RGBA，是 1、3 或 4。
cv.cvtColor（dst，dst，cv.COLOR_***2RGBA）;

然后，从 dst 新建一个 ImageData obj：

let imgData = new ImageData（new Uint8ClampedArray(dst.data, dst.cols,dst.rows);

最后，显示它：

let canvas = document.getElementById（canvasOutputId）;
let ctx = canvas.getContext（'2d'）;
ctx.clearRect(0, 0,canvas.width, canvas.height);
canvas.width = imgData.width;
canvas.height = imgData.height;
ctx.putImageData(imgData, 0, 0);

我们使用 cv.imread（imageSource）从html画布或img元素中读取图像。

参数:imageSource: 画布元素或 ID，或 IMG 元素或 ID。

返回值： 通道以 RGBA 顺序存储。

我们使用 cv.imshow（canvasSource，mat）来显示它。该函数可能会缩放mat，具体取决于其深度：

如果 mat 是 8 位无符号的，它将按原样显示。如果mat 是 16 位无符号或 32 位整数，则像素除以 256。也就是说，值范围 [0，255*256] 映射到 [0，255]。如果mat 是 32 位浮点数，则像素值乘以 255。也就是说，值范围 [0，1] 映射到 [0，255]。

参数:canvasSource：画布元素或 ID。

mat：要显示的mat。

上面的图像读取和显示代码可以简化如下：

let img = cv.imread(imageSource);
cv.imshow(canvasOutput, img);
img.delete();

示例：

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
// 为了区分输入和输出，我们对图像进行了灰度处理
// 您可以尝试不同的转换
cv.cvtColor(src, dst, cv.COLOR_RGBA2GRAY);
cv.imshow('canvasOutput', dst);
src.delete();
dst.delete();

示例：

视频入门

学习从相机捕获视频并播放

通常，我们必须使用相机捕获实时流。在OpenCV.js中，我们使用WebRTC和HTML canvas元素来实现这一点。让我们从相机（内置或USB）捕获视频，将其转换为灰度视频并显示。

首先，我们使用WebRTC navigator.mediaDevices.getUserMedia来获取媒体流。

let video = document.getElementById("videoInput")); //videoInput是<video>标签的 ID
navigator.mediaDevices.getUserMedia({ video： true, audio： false })
    .then(function(stream) {
        video.srcObject = stream;
        video.play();
    })
    .catch(function(err) {
        console.log("An error occured! " + err);
    });

从视频文件捕获视频时，不需要此功能。但请注意，HTML视频元素仅支持Ogg（Theora），WebM（VP8 / VP9）或MP4（H.264）的视频格式。

播放视频

现在，浏览器获取相机流。然后，我们使用 Canvas 2D API 的 CanvasRenderingContext2D.drawImage（）方法将视频绘制到画布上。最后，我们可以使用图像入门中的方法来读取和显示画布中的图像。为了播放视频，cv.imshow（）应该每延迟一毫秒执行一次。我们推荐 setTimeout（）方法。如果视频为 30fps，则延迟毫秒应为（1000/30 - processing_time）。

let canvasFrame = document.getElementById("canvasFrame"); // canvasFrame是<canvas>标签的ID 
let context = canvasFrame.getContext("2d");
let src = new cv.Mat(height, width, cv.CV_8UC4);
let dst = new cv.Mat(height, width, cv.CV_8UC1);
const FPS = 30;
function processVideo() {
    let begin = Date.now();
    context.drawImage(video, 0, 0, width, height);
    src.data.set(context.getImageData(0, 0, width, height).data);
    cv.cvtColor(src, dst, cv.COLOR_RGBA2GRAY);
    cv.imshow("canvasOutput", dst); // canvasOutput是另一个<canvas>标签的 id;
    // 播放下一个
    let delay = 1000/FPS - (Date.now() - begin);
    setTimeout(processVideo, delay);
}
// 播放第一个
setTimeout(processVideo, 0);

OpenCV.js 使用上述方法实现 cv.VideoCapture(videoSource)您无需手动添加隐藏的画布元素。

videoSource：视频 ID 或元素

上面的视频播放代码可以简化如下：

let src = new cv.Mat(height, width, cv.CV_8UC4);
let dst = new cv.Mat(height, width, cv.CV_8UC1);
let cap = new cv.VideoCapture(videoSource);
const FPS = 30;
function processVideo() {
    let begin = Date.now();
    cap.read(src);
    cv.cvtColor(src, dst, cv.COLOR_RGBA2GRAY);
    cv.imshow("canvasOutput", dst);
    // 播放下一个
    let delay = 1000/FPS - (Date.now() - begin);
    setTimeout(processVideo, delay);
}
// 播放第一个
setTimeout(processVideo, 0);

请记住在停止后删除 src 和 dst

完整示例：

let video = document.getElementById('videoInput');
let src = new cv.Mat(video.height, video.width, cv.CV_8UC4);
let dst = new cv.Mat(video.height, video.width, cv.CV_8UC1);
let cap = new cv.VideoCapture(video); //创建相机捕捉实例。请正确连接相机设备。否则可能报错“相机错误：未找到错误请求的设备”

const FPS = 30;
function processVideo() {
    try {
        if (!streaming) {
            // 清除src和dst并停止任务
            src.delete();
            dst.delete();
            return;
        }
        let begin = Date.now();
        // 开始处理.
        cap.read(src);
        cv.cvtColor(src, dst, cv.COLOR_RGBA2GRAY);
        cv.imshow('canvasOutput', dst);
        // 播放第二个
        let delay = 1000/FPS - (Date.now() - begin);
        setTimeout(processVideo, delay);
    } catch (err) {
        utils.printError(err);
    }
};

// 播放第一个
setTimeout(processVideo, 0);

示例：

向应用程序添加跟踪栏

创建跟踪栏以控制某些参数

使用 HTML DOM 输入范围对象将跟踪栏添加到应用程序。

首先，我们需要创建三个画布元素：两个用于输入，一个用于输出。请参阅教程图像入门。

let src1 = cv.imread('canvasInput1');
let src2 = cv.imread('canvasInput2');

然后，我们使用 HTML DOM 输入范围对象来实现跟踪栏,如下所示：

type=“range” 的 <input>属性在 Internet Explorer 9 和更早版本中不支持。

您可以使用 document.createElement()方法创建一个 type=“range” 的 <input>元素：

let x = document.createElement('INPUT');
x.setAttribute('type', 'range');

您也可以使用 getElementById()访问type="range"的 <input>元素：

let x = document.getElementById('myRange');

作为跟踪栏，range 元素需要跟踪栏名称、默认值、最小值、最大值、步长和每次跟踪栏值更改时执行的回调函数。回调函数始终具有默认参数，即跟踪栏位置。此外，显示跟踪栏值的文本元素也可以。在我们的例子中，我们可以创建如下所示的跟踪栏：

重量: <input type="range" id="trackbar" value="50" min="0" max="100" step="1" oninput="callback()">
<input type="text" id="weightValue" size="3" value="50"/>

最后，我们可以在回调函数中使用跟踪栏值，混合两张图片，并显示结果。

let weightValue = document.getElementById('weightValue');
let trackbar = document.getElementById('trackbar');
weightValue.setAttribute('value', trackbar.value);
let alpha = trackbar.value/trackbar.max;
let beta = ( 1.0 - alpha );
let src1 = cv.imread('canvasInput1');
let src2 = cv.imread('canvasInput2');
let dst = new cv.Mat();
cv.addWeighted( src1, alpha, src2, beta, 0.0, dst, -1);
cv.imshow('canvasOutput', dst);
dst.delete();
src1.delete();
src2.delete();

完整示例：

let trackbar = document.getElementById('trackbar');
let alpha = trackbar.value/trackbar.max;
let beta = ( 1.0 - alpha );
let src1 = cv.imread('canvasInput1');
let src2 = cv.imread('canvasInput2');
let dst = new cv.Mat();
cv.addWeighted( src1, alpha, src2, beta, 0.0, dst, -1);
cv.imshow('canvasOutput', dst);
dst.delete();
src1.delete();
src2.delete();

示例:

核心业务

在本节中，您将学习一些对图像的基本操作，一些数学工具和一些数据结构等。

图像的基本操作

学习读取和编辑像素值，使用图像ROI和其他基本操作。

访问图像属性

图像属性包括行数、列数和大小、深度、通道、图像数据类型。

let src = cv.imread("canvasInput");
console.log('图像宽度: ' + src.cols + '\n' +
            '图像高度: ' + src.rows + '\n' +
            '图像大小: ' + src.size().width + '*' src.size().height + '\n' +
            '图像深度: ' + src.depth() + '\n' +
            '图像通道' + src.channels() + '\n' +
            '图像类型' + src.type() + '\n');

src.type()在调试时非常重要，因为 OpenCV.js 代码中的大量错误是由无效数据类型引起的。

示例:

构建Mat(垫子)的方法

有 4 个基本构造函数：

// 1. 默认构造函数
let mat = new cv.Mat();
// 2. 按大小和类型划分的二维数组
let mat = new cv.Mat(size, type);
// 3. 按行、列和类型划分的二维数组
let mat = new cv.Mat(rows, cols, type);
// 4. 具有初始化值的行、列和类型的二维数组
let mat = new cv.Mat(rows, cols, type, new cv.Scalar());

有 3 个静态函数：

// 1. 创建一个充满零的垫子
let mat = cv.Mat.zeros(rows, cols, type);
// 2. 创建一个充满垫子的垫子
let mat = cv.Mat.ones(rows, cols, type);
// 3. 创建一个作为单位矩阵的垫子
let mat = cv.Mat.eye(rows, cols, type);

有 2 个工厂函数：

// 1. 使用 JS 数组构造一个垫子(mat)
// 例如: let mat = cv.matFromArray(2, 2, cv.CV_8UC1, [1, 2, 3, 4]);
let mat = cv.matFromArray(rows, cols, type, array);
// 2. 使用 imgData 构建一个垫子
let ctx = canvas.getContext("2d");
let imgData = ctx.getImageData(0, 0, canvas.width, canvas.height);
let mat = cv.matFromImageData(imgData);

当您不想再使用它时，不要忘记删除 cv.Mat。

复制垫子

有两种方法可以复制 Mat：

// 1. 克隆
let dst = src.clone();
// 2. 复制到（仅复制mask中指示的条目）
src.copyTo(dst, mask);

转换垫子的类型

我们使用函数：convertTo（m， rtype， alpha = 1， beta = 0）

参数	参数说明
m	输出矩阵;如果在操作之前没有适当的大小或类型，则会重新分配它。
rtype	所需的输出矩阵类型，或者更确切地说，深度，因为通道数与输入相同;如果 rtype 为负，则输出矩阵的类型将与输入矩阵的类型相同。
alpha	可选比例因子。默认：1
beta	添加到缩放值的可选增量。默认：0

src.convertTo(dst, rtype);

使用 MatVector

let mat = new cv.Mat();
// 初始化矩阵向量
let matVec = new cv.MatVector();
// 将垫子推回 MatVector
matVec.push_back(mat);
// 获取垫子矢量
let cnt = matVec.get(0);
mat.delete(); matVec.delete(); cnt.delete();

不要忘记删除cv.Mat，cv.MatVector和cnt（你从MatVector获得的垫子），当你不想再使用它们时。

访问和修改像素值

首先，您应该了解以下类型关系：

数据属性	C++类型	JavaScript 类型数组	垫子（Mat）类型
data	uchar	Uint8Array	CV_8U
data8S	char	Int8Array	CV_8S
data16U	ushort	Uint16Array	CV_16U
data16S	short	Int16Array	CV_16S
data32S	int	Int32Array	CV_32S
data32F	float	Float32Array	CV_32F
data64F	double	Float64Array	CV_64F

1、数据

let row = 3, col = 4;
let src = cv.imread("canvasInput");
if (src.isContinuous()) {
    let R = src.data[row * src.cols * src.channels() + col * src.channels()];
    let G = src.data[row * src.cols * src.channels() + col * src.channels() + 1];
    let B = src.data[row * src.cols * src.channels() + col * src.channels() + 2];
    let A = src.data[row * src.cols * src.channels() + col * src.channels() + 3];
}

数据操作仅对连续 Mat 有效。你应该先使用 isContinu（）进行检查。

2、at类型

垫子类型	At 操作
CV_8U	ucharAt
CV_8S	charAt
CV_16U	ushortAt
CV_16S	shortAt
CV_32S	intAt
CV_32F	floatAt
CV_64F	doubleAt

let row = 3, col = 4;
let src = cv.imread("canvasInput");
let R = src.ucharAt(row, col * src.channels());
let G = src.ucharAt(row, col * src.channels() + 1);
let B = src.ucharAt(row, col * src.channels() + 2);
let A = src.ucharAt(row, col * src.channels() + 3);

at 操作仅适用于单通道访问，无法修改该值。

3、PTR

垫子类型	PTR 操作	JavaScript 类型数组
CV_8U	ucharPtr	Uint8Array
CV_8S	charPtr	Int8Array
CV_16U	ushortPtr	Uint16Array
CV_16S	shortPtr	Int16Array
CV_32S	intPtr	Int32Array
CV_32F	floatPtr	Float32Array
CV_64F	doublePtr	Float64Array

let row = 3, col = 4;
let src = cv.imread("canvasInput");
let pixel = src.ucharPtr(row, col);
let R = pixel[0];
let G = pixel[1];
let B = pixel[2];
let A = pixel[3];

mat.ucharPtr(K) 获取 mat。ucharPtr(i , j)获取 mat 的第 i 行和第 j 列。

图像投资回报率

有时，您将不得不使用某些区域的图像。对于图像中的眼睛检测，首先在整个图像中进行人脸检测，当获得人脸时，我们单独选择人脸区域并搜索其中的眼睛，而不是搜索整个图像。它提高了准确性（因为眼睛总是盯着脸）和性能（因为我们搜索一个小区域）

我们使用函数：roi (rect)

参数： rect：矩形感兴趣区域

图像投资回报率示例

在 <canvas>画布中已准备好名为 canvasInput 和 canvasOutput 的元素。

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
// 你可以尝试更多不同的参数
let rect = new cv.Rect(100, 100, 200, 200);
dst = src.roi(rect);
cv.imshow('canvasOutput', dst);
src.delete();
dst.delete();

拆分和合并图像通道

有时您需要在图像的 R、G、B 通道上单独工作。然后，您需要将RGB图像拆分为单个平面。或者其他时候，您可能需要将这些单独的通道加入 RGB 图像。

let src = cv.imread("canvasInput");
let rgbaPlanes = new cv.MatVector();
// 劈开垫子
cv.split(src, rgbaPlanes);
// 获取R通道
let R = rgbaPlanes.get(0);
// 合并所有通道
cv.merge(rgbaPlanes, src);
src.delete(); rgbaPlanes.delete(); R.delete();

当你不想再使用它们时，不要忘记删除cv.Mat，cv.MatVector和 R（你从MatVector获得的垫子）。

为图像制作边框（填充）

如果你想在图像周围创建一个边框，比如相框，你可以使用 cv.copyMakeBorder( ) 函数。但它在卷积操作、零填充等方面有更多的应用。此函数采用以下参数：

参数	参数解释
src	输入图像源
top、bottom、left、right	相应方向上像素数的边框宽度
borderType	定义要添加的边框类型的标志。见下表。
value	边框类型为cv.BORDER_CONSTANT时边框的颜色

borderType类型标志：

类型	类型解释
cv.BORDER_CONSTANT	添加恒定的彩色边框。该值应作为下一个参数给出
cv.BORDER_REFLECT	边框将是边框元素的镜像反射
cv.BORDER_REFLECT_101或者cv.BORDER_DEFAULT	同上，但略有变化
cv.BORDER_REPLICATE	最后一个元素被复制到整个元素
cv.BORDER_WRAP	无法解释

图像填充示例

在 <canvas>中已准备好名为 canvasInput 和 canvasOutput 的元素。

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
// 你可以尝试更多不同的参数
let s = new cv.Scalar(255, 0, 0, 255);
cv.copyMakeBorder(src, dst, 10, 10, 10, 10, cv.BORDER_CONSTANT, s);
cv.imshow('canvasOutput', dst);
src.delete();
dst.delete();

图像的算术运算

对图像执行算术运算。

图像添加

您可以通过 OpenCV 函数 cv.add( )添加两个图像。res = img1 + img2。两个图像应具有相同的深度和类型。

例如，请参考以下示例：

let src1 = cv.imread("canvasInput1");
let src2 = cv.imread("canvasInput2");
let dst = new cv.Mat();
let mask = new cv.Mat();
let dtype = -1;
cv.add(src1, src2, dst, mask, dtype);
src1.delete(); src2.delete(); dst.delete(); mask.delete();

图像减法

您可以通过OpenCV函数 cv.subtract( )减去两张图像。res = img1 - img2.两个图像应具有相同的深度和类型。

例如，请参考以下示例：

let src1 = cv.imread("canvasInput1");
let src2 = cv.imread("canvasInput2");
let dst = new cv.Mat();
let mask = new cv.Mat();
let dtype = -1;
cv.subtract(src1, src2, dst, mask, dtype);
src1.delete(); src2.delete(); dst.delete(); mask.delete();

按位运算

这包括按位 AND、OR、NOT 和 XOR 运算。在提取图像的任何部分、定义和使用非矩形 ROI 等时，它们将非常有用。下面我们将看到一个关于如何更改图像的特定区域的示例。

我想把OpenCV标志放在图像上方。如果我添加两个图像，它会改变颜色。如果我混合它，我会得到透明效果。但我希望它是不透明的。如果它是一个矩形区域，我可以像上一章一样使用 ROI。但OpenCV标志不是一个矩形的形状。因此，您可以使用按位运算来做到这一点。

图像按位示例

在 <canvas>中已准备好名为 canvasInput 和 canvasOutput 的元素。

let src = cv.imread('imageCanvasInput');
let logo = cv.imread('logoCanvasInput');
let dst = new cv.Mat();
let roi = new cv.Mat();
let mask = new cv.Mat();
let maskInv = new cv.Mat();
let imgBg = new cv.Mat();
let imgFg = new cv.Mat();
let sum = new cv.Mat();
let rect = new cv.Rect(0, 0, logo.cols, logo.rows);

// 我想把标志（logo）放在左上角，所以我创建了一个ROI
roi = src.roi(rect);

// 创建一个logo的蒙版，并创建它的逆蒙层
cv.cvtColor(logo, mask, cv.COLOR_RGBA2GRAY, 0);
cv.threshold(mask, mask, 100, 255, cv.THRESH_BINARY);
cv.bitwise_not(mask, maskInv);

// 将ROI中的logo区域涂黑
cv.bitwise_and(roi, roi, imgBg, maskInv);

// 从logo图像中仅取出logo区域
cv.bitwise_and(logo, logo, imgFg, mask);

// 将logo放在ROI中并修改主图像
cv.add(imgBg, imgFg, sum);

dst = src.clone();
for (let i = 0; i < logo.rows; i++) {
    for (let j = 0; j < logo.cols; j++) {
        dst.ucharPtr(i, j)[0] = sum.ucharPtr(i, j)[0];
    }
}
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete(); logo.delete(); roi.delete(); mask.delete();
maskInv.delete(); imgBg.delete(); imgFg.delete(); sum.delete();

示例：

数据结构

了解一些数据结构。您将学习一些数据结构：点，标量，宽高尺寸，圆形，矩形，旋转矩形等。

点

有两种方法可以构造一个点，它们是相同的：

// 第一种方式
let point = new cv.Point(x, y);
// 第二种方式
let point = {x: x, y: y};

参数	参数解释
x	点的 x轴坐标。（原点为图片左上角）
y	点的 y 轴坐标。

标量

有两种方法可以构造标量，它们是相同的：

// 第一种方式
let scalar = new cv.Scalar(R, G, B, Alpha);
// 第二种方式
let scalar = [R, G, B, Alpha];

参数	参数解释
R	红色通道的像素值。
G	绿色通道的像素值。
B	蓝色通道的像素值。
Alpha	阿尔法通道的像素值。

宽高尺寸

有两种方法可以构造宽高尺寸，它们是相同的：

// 第一种方式
let size = new cv.Size(width, height);
// 第二种方式
let size = {width : width, height : height};

参数	参数解释
width	宽度
height	高度

圆圈

有两种方法可以构造圆，它们是相同的：

// 第一种方式
let circle = new cv.Circle(center, radius);
// 第二种方式
let circle = {center : center, radius : radius};

参数	参数解释
center	圆心
radius	圆的半径

矩形

构造 Rect 有两种方法，它们是相同的：

// 第一种方式
let rect = new cv.Rect(x, y, width, height);
// 第二种方式
let rect = {x : x, y : y, width : width, height : height};

参数	参数解释
x	顶点的 x 坐标，即矩形的左上角。
y	顶点的 y 坐标，即矩形的左上角。
width	矩形的宽度。
height	矩形的高度。

旋转矩形

有两种方法可以构造旋转矩形，它们是相同的：

// 第一种方式
let rotatedRect = new cv.RotatedRect(center, size, angle);
// 第二种方式
let rotatedRect = {center : center, size : size, angle : angle};

参数	参数解释
center	矩形质量中心。
size	矩形的宽度和高度。
angle	顺时针方向的旋转角度。当角度为 0、90、180、270 等时，矩形变为直立矩形。

从 rotatedRect 获取顶点：

我们使用函数：cv.RotatedRect.points（rotatedRect）

rotatedRect：旋转矩形

let vertices = cv.RotatedRect.points(rotatedRect);
let point1 = vertices[0];
let point2 = vertices[1];
let point3 = vertices[2];
let point4 = vertices[3];

从 rotatedRect 获取边框：

我们使用函数：cv.RotatedRect.boundingRect（rotatedRect）

rotatedRect：旋转矩形

let boundingRect = cv.RotatedRect.boundingRect(rotatedRect);

图像处理

在本节中，您将学习OpenCV中的不同图像处理功能。

更改色彩空间

了解如何在不同色彩空间之间更改图像。

OpenCV 中提供了 150 多种颜色空间转换方法。但是我们将研究使用最广泛的一个：RGB↔灰色。

我们使用函数：cv.cvtColor （src， dst， code， dstCn = 0）

参数	参数解释
src	输入图像。
dst	输出与输入图像相同大小和深度的图像
code	色彩空间转换代码（参见cv.颜色转换代码）。
dstCn	目标图像中的通道数;如果参数为 0，则通道数自动从输入图像和代码派生。

对于 RGB→灰色转换我们使用代码 cv.COLOR_RGBA2GRAY。

转换颜色示例

在 <canvas> 已准备好名为 canvasInput 和 canvasOutput 的元素。

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
// 你可以尝试更多不同的参数
cv.cvtColor(src, dst, cv.COLOR_RGBA2GRAY, 0);
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete();

范围之内

检查数组元素是否位于其他两个数组的元素之间。

我们使用函数：cv.inRange （src， lowerb， upperb， dst）

参数	参数解释
src	第一个输入图像。
lowerb	包含与第一个输入图像相同大小的下边界Mat。
upperb	包含与第一个输入图像大小相同的上边界Mat。
dst	输出图像大小与第一个输入图像相同，cv.CV_8U类型。

图像范围示例

在 <canvas> 已准备好名为 canvasInput 和 canvasOutput 的元素。

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
let low = new cv.Mat(src.rows, src.cols, src.type(), [0, 0, 0, 0]);
let high = new cv.Mat(src.rows, src.cols, src.type(), [150, 150, 150, 255]);
// 你可以尝试更多不同的参数
cv.inRange(src, low, high, dst);
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete(); low.delete(); high.delete();

示例:

图像的几何变换

了解如何对图像应用不同的几何变换，如旋转、平移等。

缩放

缩放只是调整图像的大小。OpenCV为此附带了一个函数 cv.resize（）。可以手动指定图像的大小，也可以指定比例因子。使用不同的插值方法。优选的插值方法是 cv.INTER_AREA用于收缩，cv.INTER_CUBIC（slow）和cv.INTER_LINEAR用于缩放。

我们使用函数：cv.resize （src， dst， dsize， fx = 0， fy = 0， interpolation = cv.INTER_LINEAR）

参数	参数解释
src	输入图像
dst	输出图像;它的大小为dsize（当它不为零时）或从src.size（），fx和fy计算的大小;DST 的类型与 src的类型相同。
dsize	输出图像大小。
fx	沿横轴的比例因子。
fy	沿纵轴的比例因子。
interpolation	插值方法（参见cv.插值标志）)。

图像大小调整示例

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
let dsize = new cv.Size(300, 300);
// 你可以尝试更多不同的参数
cv.resize(src, dst, dsize, 0, 0, cv.INTER_AREA);
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete();

示例:

变换

变换是物体位置的转移。

我们使用函数：cv.warpAffine （src， dst， M， dsize， flags = cv.INTER_LINEAR， borderMode = cv.BORDER_CONSTANT， borderValue = new cv.Scalar（））

参数	参数解释
src	输入图像。
dst	输出大小为 dsize 且类型与 src 相同的图像。
Mat	2 × 3 转换矩阵（cv.CV_64FC1 型）。
dsize	输出图像的大小。
flags	插值方法（参见cv.InterpolationFlags）和可选标志WARP_INVERSE_MAP的组合，这意味着M是逆变换（dst→src）
borderMode	像素外推法（见cv.BorderTypes）;当borderMode=BORDER_TRANSPARENT时，表示目标图像中与源图像中的“异常值”对应的像素不会被函数修改。
borderValue	在恒定边框的情况下使用的值;默认情况下，它为 0。

仿射变换示例

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
let M = cv.matFromArray(2, 3, cv.CV_64FC1, [1, 0, 50, 0, 1, 100]);
let dsize = new cv.Size(src.rows, src.cols);
// 你可以尝试更多不同的参数
cv.warpAffine(src, dst, M, dsize, cv.INTER_LINEAR, cv.BORDER_CONSTANT, new cv.Scalar());
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete(); M.delete();

示例：

旋转

旋转图像的角度θ通过表单的变换矩阵实现。但是 OpenCV 提供缩放旋转和可调节旋转中心，因此您可以在您喜欢的任何位置旋转。

我们使用函数：cv.getRotationMatrix2D （center, angle, scale）

参数	参数解释
center	源图像中旋转的中心。
angle	旋转角度（以度为单位）。正值表示逆时针旋转（假定坐标原点为左上角）。
scale	各向同性比例因子。

旋转变换示例

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
let dsize = new cv.Size(src.rows, src.cols);
let center = new cv.Point(src.cols / 2, src.rows / 2);
// 你可以尝试更多不同的参数
let M = cv.getRotationMatrix2D(center, 45, 1);
cv.warpAffine(src, dst, M, dsize, cv.INTER_LINEAR, cv.BORDER_CONSTANT, new cv.Scalar());
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete(); M.delete();

示例：

仿射变换

在仿射变换中，原始图像中的所有平行线在输出图像中仍将平行。要找到转换矩阵，我们需要输入图像中的三个点及其在输出图像中的相应位置。然后 cv.getAffineTransform将创建一个2x3矩阵，该矩阵将传递给 cv.warpAffine。

我们使用函数：cv.getAffineTransform（src，dst）

参数	参数解释
src	来自输入图像的三个点（[3， 1] 大小和cv.CV_32FC2类型）。
dst	输出图像中的三个对应点（[3， 1] 大小和cv.CV_32FC2类型）。

获取仿射变换示例

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
// (data32F[0], data32F[1]) 是第一个点
// (data32F[2], data32F[3]) 是第二个点
// (data32F[4], data32F[5]) 是第三个点
let srcTri = cv.matFromArray(3, 1, cv.CV_32FC2, [0, 0, 0, 1, 1, 0]);
let dstTri = cv.matFromArray(3, 1, cv.CV_32FC2, [0.6, 0.2, 0.1, 1.3, 1.5, 0.3]);
let dsize = new cv.Size(src.rows, src.cols);
let M = cv.getAffineTransform(srcTri, dstTri);
// 你可以尝试更多不同的参数
cv.warpAffine(src, dst, M, dsize, cv.INTER_LINEAR, cv.BORDER_CONSTANT, new cv.Scalar());
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete(); M.delete(); srcTri.delete(); dstTri.delete();

示例：

透视转换

对于透视转换，您需要一个 3x3 转换矩阵。即使在转换后，直线仍将保持直线。要找到此转换矩阵，您需要在输入图像上 4 个点和输出图像上的相应点。在这 4 点中，有 3 点不应该是共线的。然后可以通过函数 cv.getPerspectiveTransform 找到转换矩阵。然后将 cv.warpPerspective 与这个 3x3 转换矩阵一起应用。

我们使用函数：cv.warpPerspective （src， dst， M， dsize， flags = cv.INTER_LINEAR， borderMode = cv.BORDER_CONSTANT， borderValue = new cv.Scalar（））

参数	参数解释
src	输入图像。
dst	输出大小为 dsize 且类型与 SRC 相同的图像。
M	3 × 3 转换矩阵（cv.CV_64FC1 型）。
dsize	输出图像的大小。
flags	插值方法（cv.INTER_LINEAR 或 cv.INTER_NEAREST）和可选标志WARP_INVERSE_MAP的组合，将 M 设置为逆变换（dst→src）。
borderMode	像素外推法（cv.BORDER_CONSTANT或cv.BORDER_REPLICATE）。
borderValue	在恒定边框的情况下使用的值;默认情况下，它为 0。

cv.getPerspectiveTransform （src， dst）

参数	参数解释
src	源图像中四边形顶点的坐标。
dst	目标图像中相应四边形顶点的坐标。

透视变换示例

let src = cv.imread('canvasInput');
let dst = new cv.Mat();
let dsize = new cv.Size(src.rows, src.cols);
// (data32F[0], data32F[1]) 是第一个点
// (data32F[2], data32F[3]) 是第二个点
// (data32F[4], data32F[5]) 是第三个点
// (data32F[6], data32F[7]) 是第四个点
let srcTri = cv.matFromArray(4, 1, cv.CV_32FC2, [56, 65, 368, 52, 28, 387, 389, 390]);
let dstTri = cv.matFromArray(4, 1, cv.CV_32FC2, [0, 0, 300, 0, 0, 300, 300, 300]);
let M = cv.getPerspectiveTransform(srcTri, dstTri);
// 你可以尝试更多不同的参数
cv.warpPerspective(src, dst, M, dsize, cv.INTER_LINEAR, cv.BORDER_CONSTANT, new cv.Scalar());
cv.imshow('canvasOutput', dst);
src.delete(); dst.delete(); M.delete(); srcTri.delete(); dstTri.delete();

示例：

视频分析

在本节中，您将学习使用对象跟踪等视频的不同技术。

物体检测

在本节中，您将使用人脸检测等对象检测技术。

OpenCV.js

OpenCV.js简介

OpenCV.js简介

使用OpenCV.js

下载OpenCV.js

第一步：创建网页

第二步：使用OpenCV.js

图形用户界面功能

图像入门

视频入门

向应用程序添加跟踪栏

核心业务

图像的基本操作

图像的算术运算

数据结构

图像处理

更改色彩空间

图像的几何变换

缩放

变换

旋转

仿射变换

透视转换

*图像阈值

平滑图像

形态转化

图像渐变

精明边缘检测

图像金字塔

OpenCV中的轮廓.js

OpenCV中的直方图.js

OpenCV中的图像转换.js

模板匹配

霍夫线变换

霍夫圆变换

基于分水岭算法的图像分割

使用 GrabCut 算法进行前景提取

用于视频捕获的图像处理

视频分析

物体检测