常用正则表达式—邮箱(Email)

 要验证一个字符串是否为邮箱的话,首先要了解邮箱账号的格式。我尝试过在网上找出一个标准的格式,但是很遗憾我没有找到。我也尝试使用RFC标准来判断邮箱的格式,但是也没有结果。网上些博客说不应该使用RFC标准来验证邮箱是否合法,有兴趣的可以看看“is this email valid?”和“Don’t RFC-Validate Email Addresses”。据了解【参考】,现在用中文命名的邮箱也合法了,比如“杨元庆@联想.中国”。

 虽然没有统一的邮箱账号格式,但是所有邮箱都符合“名称@域名”的规律。对于名称和域名的字符限制,我们可以根据项目的情况定义一个,比如只允许有英文、数字、下划线等组成。下面举例实现一些验证邮箱格式的正则表达式。

实例1、只允许英文字母、数字、下划线、英文句号、以及中划线组成

举例:zhangsan-001@gmail

分析邮件名称部分:

  • 26个大小写英文字母表示为a-zA-Z
  • 数字表示为0-9
  • 下划线表示为_
  • 中划线表示为-

由于名称是由若干个字母、数字、下划线和中划线组成,所以需要用到+表示多次出现

  • 根据以上条件得出邮件名称表达式:[a-zA-Z0-9_-]+

分析域名部分:

 一般域名的规律为“[N级域名][三级域名.]二级域名.顶级域名”,比如“qq”、“www.qq”、“mp.weixin.qq”、“12-34”,分析可得域名类似“** .** .** .”组成。“”部分可以表示为[a-zA-Z0-9_-]+

“.”部分可以表示为.[a-zA-Z0-9_-]+多个“.”可以表示为(.[a-zA-Z0-9_-]+)+

 综上所述,域名部分可以表示为[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+

最终表达式:由于邮箱的基本格式为“名称@域名”,需要使用“^”匹配邮箱的开始部分,用“$”匹配邮箱结束部分以保证邮箱前后不能有其他字符,所以最终邮箱的正则表达式为:

 ^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$

实例2、名称允许汉字、字母、数字,域名只允许英文域名

举例:杨元庆001Abc@lenovo

分析邮件名称部分:

  • 汉字在正则表示为[\u4e00-\u9fa5]
  • 字母和数字表示为A-Za-z0-9
  •  通过分析得出邮件名称部分表达式为[A-Za-z0-9\u4e00-\u9fa5]+

分析邮件域名部分

  •  邮件部分可以参考实例1中的分析域名部分。
  •  得出域名部分的表达式为[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+

最终表达式:我们用@符号将邮箱的名称和域名拼接起来,因此完整的邮箱表达式为

  ^[A-Za-z0-9\u4e00-\u9fa5]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$

题目 

测试数据及结果  mysql

DROP TABLE IF EXISTS `client_into`;
CREATE TABLE `client_into`  (
  `Emall` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `result` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL
);
INSERT INTO `client_into` VALUES ('17562+343284@qq', NULL);
INSERT INTO `client_into` VALUES ('www.ingdsf@163', NULL);
INSERT INTO `client_into` VALUES ('s-adyfs@cloud', NULL);
INSERT INTO `client_into` VALUES ('sfdffad+@cloud', NULL);
INSERT INTO `client_into` VALUES ('www.ugsd87345', NULL);
INSERT INTO `client_into` VALUES (NULL, NULL);
INSERT INTO `client_into` VALUES ('4 8dfsaf@qq', NULL);
INSERT INTO `client_into` VALUES ('q******@qq', NULL);
INSERT INTO `client_into` VALUES ('dfhysd_@126', NULL);
INSERT INTO `client_into` VALUES ('sfdffad@cloud', NULL);

SELECT emall,case when emall REGEXP '^[a-zA-Z0-9]+[.+-]+[a-zA-Z0-9]+@[a-zA-Z0-9.-]+\.[a-zA-Z0-9.-]+$' 
 then '符合' else '不符合' end as result FROM `client_into`;

更多推荐

关于邮箱的正则表达式