使用 Microsoft Power BI 工具进行 Web 抓取分析





5.00/5 (2投票s)
使用 Microsoft Power BI 工具进行 Web 抓取分析
引言
每当我们谈论网络抓取或网络数据提取时,我们总是认为这会是一个困难的部分,请相信我,要获得确切的 HTML 代码并获取所需内容有点复杂,并非易事。
但是 Power BI 使提取我们可以进行分析的数据变得非常容易。
让我在这里举个例子。假设我们想创建一个工具,从不同的购物网站提取数据并进行比较,以获得特定产品的最佳交易。
这种数据的提取和比较可以在 Microsoft Power BI 中通过几个简单的步骤完成。
让我们通过本文中提到的几个步骤,以实践的方式更好地理解它。
在本例中,我们将从 Amazon.in 网站提取数据。
步骤 1
打开 Web 数据源,并提供您要从中获取数据的网页的 URL。 如下图所示,我们将从以下 URL 提取数据
第二步
当您点击“确定”按钮时,您将得到一个新弹窗,Power BI 在其中尝试提取数据并为您提供表格。 如下图所示,Power BI 提供了两个表格,文档
和 表格 0
。
但是,当您查看这些表格时,您没有获得任何有用的信息。 因此,Power BI 具有根据您的要求提取数据的功能。 为此,您必须单击“使用示例添加表格”按钮。
步骤 3
单击按钮后,您将得到一个新弹出的屏幕,如下图所示。
您可以看到弹窗中有 2 个部分 - 第一部分是网页视图,您可以在这里看到我们想要提取数据的页面。
第二部分是我们通过向 Power BI 提供一些示例来创建的表格结构。
步骤 4
现在,在这里我们必须提取产品名称、价格和百分比优惠。 因此,我们将用 1 或 2 个例子来训练 Power BI。 假设 Column1
将保存 产品
名称。 我们可以看到,网页中的 产品
名称是“Kevin 80 Cm
”、“WOW Raw apple
”等。 因此,在第一列中,我们将尝试写下 Kelvin
,您将看到 Power BI 提取的数据列表。 只需选择确切的名称,按照这个步骤操作 2 或 3 行,您就会惊讶地看到其余的行数据将自动填充。
步骤 5
现在在下面的表格中添加另一列,我们将在其中保留项目的价格。
因此,正如您所看到的,对于 Kevin 80 cm 电视
,价格是 8,499
。 因此,当您单击并尝试写入金额 8499
时,Power BI 足够智能,可以提供具有相似值的提取数据列表。 尝试对接下来的 2 或 3 行执行相同的步骤,您将找到与产品名称对应的所有价格。
步骤 6
现在,我们将获取百分比优惠的数据。 正如您所看到的,对于 kevin 电视
,价格是 39% off
。 因此,要实现这一点,只需在网格中添加另一列,并尝试键入 39%
,正如您在下图中看到的那样。 只要对其他几行重复该步骤,Power BI 就会为其余的行执行此操作。
步骤 7
哇,您已经提取了您想要的数据,到目前为止您可以在下图中看到
步骤 8
现在,只需单击 加载 按钮继续,您将获得以下屏幕。 通过选择 自定义表格 继续。
步骤 9
现在,好消息! 您获得了您想要的数据,您可以在网格中看到
第 10 步
唯一可能困扰您的事情是,在 百分比优惠
列中,您看到了括号和额外的 % Off
文本。 现在,为了避免这种情况,只需按示例添加另一列,您就可以看到下面的屏幕。
第 11 步
太好了! 现在您拥有了您想要的数据。
现在,我们有了数据,因此我们可以应用我们想要的任何分析。
希望此功能对您有所帮助。
快乐学习!
历史
- 2019年3月9日:初始版本