65.9K
CodeProject 正在变化。 阅读更多。
Home

使用 Microsoft Power BI 工具进行 Web 抓取分析

starIconstarIconstarIconstarIconstarIcon

5.00/5 (2投票s)

2019年3月9日

CPOL

4分钟阅读

viewsIcon

11516

使用 Microsoft Power BI 工具进行 Web 抓取分析

引言

每当我们谈论网络抓取或网络数据提取时,我们总是认为这会是一个困难的部分,请相信我,要获得确切的 HTML 代码并获取所需内容有点复杂,并非易事。

但是 Power BI 使提取我们可以进行分析的数据变得非常容易。

让我在这里举个例子。假设我们想创建一个工具,从不同的购物网站提取数据并进行比较,以获得特定产品的最佳交易。

这种数据的提取和比较可以在 Microsoft Power BI 中通过几个简单的步骤完成。

让我们通过本文中提到的几个步骤,以实践的方式更好地理解它。

在本例中,我们将从 Amazon.in 网站提取数据。

步骤 1

打开 Web 数据源,并提供您要从中获取数据的网页的 URL。 如下图所示,我们将从以下 URL 提取数据

import_data_from_Site_1

第二步

当您点击“确定”按钮时,您将得到一个新弹窗,Power BI 在其中尝试提取数据并为您提供表格。 如下图所示,Power BI 提供了两个表格,文档表格 0

import_data_from_Site_2

但是,当您查看这些表格时,您没有获得任何有用的信息。 因此,Power BI 具有根据您的要求提取数据的功能。 为此,您必须单击“使用示例添加表格”按钮。

步骤 3

单击按钮后,您将得到一个新弹出的屏幕,如下图所示。

您可以看到弹窗中有 2 个部分 - 第一部分是网页视图,您可以在这里看到我们想要提取数据的页面。

第二部分是我们通过向 Power BI 提供一些示例来创建的表格结构。

import_data_From_Site_3

步骤 4

现在,在这里我们必须提取产品名称、价格和百分比优惠。 因此,我们将用 1 或 2 个例子来训练 Power BI。 假设 Column1 将保存 产品 名称。 我们可以看到,网页中的 产品 名称是“Kevin 80 Cm”、“WOW Raw apple”等。 因此,在第一列中,我们将尝试写下 Kelvin,您将看到 Power BI 提取的数据列表。 只需选择确切的名称,按照这个步骤操作 2 或 3 行,您就会惊讶地看到其余的行数据将自动填充。

import_data_from_Site_4

步骤 5

现在在下面的表格中添加另一列,我们将在其中保留项目的价格。

因此,正如您所看到的,对于 Kevin 80 cm 电视,价格是 8,499。 因此,当您单击并尝试写入金额 8499 时,Power BI 足够智能,可以提供具有相似值的提取数据列表。 尝试对接下来的 2 或 3 行执行相同的步骤,您将找到与产品名称对应的所有价格。

import_data_from_Site_5

步骤 6

现在,我们将获取百分比优惠的数据。 正如您所看到的,对于 kevin 电视,价格是 39% off。 因此,要实现这一点,只需在网格中添加另一列,并尝试键入 39%,正如您在下图中看到的那样。 只要对其他几行重复该步骤,Power BI 就会为其余的行执行此操作。

import_data_From_Site_6

步骤 7

哇,您已经提取了您想要的数据,到目前为止您可以在下图中看到

import_data_from_Site_7

步骤 8

现在,只需单击 加载 按钮继续,您将获得以下屏幕。 通过选择 自定义表格 继续。

import_data_from_Site_8

步骤 9

现在,好消息! 您获得了您想要的数据,您可以在网格中看到

import_data_from_Site_9

第 10 步

唯一可能困扰您的事情是,在 百分比优惠 列中,您看到了括号和额外的 % Off 文本。 现在,为了避免这种情况,只需按示例添加另一列,您就可以看到下面的屏幕。

import_data_from_site_10

第 11 步

太好了! 现在您拥有了您想要的数据。

import_data_from_site_11

现在,我们有了数据,因此我们可以应用我们想要的任何分析。

希望此功能对您有所帮助。

快乐学习!

历史

  • 2019年3月9日:初始版本
© . All rights reserved.