java字符串中英文(java字符串中文乱码如何解决)
华为云服务器特价优惠火热进行中! 2核2G2兆仅需 38 元;4核4G3兆仅需 79 元。购买时间越长越优惠!更多配置及优惠价格请咨询客服。
合作流程: |
今天给各位分享java字符串中英文的知识,其中也会对java字符串中文乱码如何解决进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
微信号:cloud7591如需了解更多,欢迎添加客服微信咨询。
复制微信号
本文目录一览:
- 1、Java判断字符串是中文还是英文
- 2、java如何向文件写入字符串(包括中英文),保证写入的内容在文件中不出乱码?有没有一种简单的方法?
- 3、请教:JAVA中英文字符串截取的问题
- 4、请问java中字符串中英文占几个字节?
- 5、在java中如何判断一个字符串是中文的还是英文的
- 6、JAVA中:中英文混合的字符串按字节截取问题
Java判断字符串是中文还是英文
// 判断一个字符是否是中文升袭
public static boolean isChinese(char c) {
return c = 0x4E00 c = 0x9FA5;// 根据字察笑轿节码判断
}
// 判断一个字符串是否败肆含有中文
public static boolean isChinese(String str) {
if (str == null) return false;
for (char c : str.toCharArray()) {
if (isChinese(c)) return true;// 有一个中文字符就返回
}
return false;
}

java如何向文件写入字符串(包括中英文),保证写入的内容在文件中不出乱码?有没有一种简单的方法?
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.InputStreamReader;
public class WriteFile {
public static void main(String[] args) throws Exception {
System.out.println("请输升行培入要写入文件的内带局容吵唯:");
BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
String str = br.readLine();
BufferedWriter bw = new BufferedWriter(new FileWriter(new File(
"e://aa.txt")));
bw.write(str);
bw.close();
br.close();
}
}
请教:JAVA中英文字符串截取的问题
//完整程序如下,字符串可以随机的:
import java.util.Iterator;
import java.util.Vector;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Grouping {
/**
* @param args
*/
public static void main(String[] args) {
// TODO 自动生成方法存根
String s = "a99中国b香港c恒生dd嘿嘿";
String regex = "\\w";
Pattern p = Pattern.compile(regex);
String intercept = "";
String intercept2 = ""陆孙;
VectorString output = new VectorString拿档();
for(int i = 0;i s.length();i ++){
String input = s.substring(i,i + 1);
Matcher m = p.matcher(input);
boolean b = m.matches();
if(b){
output.add(intercept2);
intercept2 = "";
intercept = intercept + input;
}else{
output.add(intercept);
intercept = "";
intercept2 = intercept2 + input;
}
}
//添加最消悉乱后一串字符
if(intercept.equals("")){
output.add(intercept2);
}else{
output.add(intercept);
}
Iterator it = output.iterator();
System.out.println("原始字符串为:" + s);
System.out.print("分隔后的字符串为:");
while(it.hasNext()){
System.out.print(((String)it.next()).trim());
if(it.hasNext()){
System.out.print(" ");
}
}
}
}
请问java中字符串中英文占几个字节?
java里
的卖御char是占2个字节的
也就是一个说
英文和数字也都是占2个字节的
还有编码是统一的
不可能想你说的
英文与数字字符属于ASCII编码,
故占用一个字节,
中文字符属于GBK编码,差行占两虚配哗个字节
如果用ascii来解码
那整个文件都是按照ascii来解码的~
说到编码的话
其实现在utf-8用的最多
在java中如何判断一个字符串是中文的还是英文的
下满给出示例代码,希望对你有帮助
Java中判断字符串的编码有两种思路:
一种是根据byte的长度判断,英文的字母数字好标点符号都是一个byte,且值在0-255之间
另一种是根据中文的Unicode取值范围判断,这个就是把所以的范围都包含,才能判断正确,参考unicode中文范围:
示例代码:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class StringTest {
//英文占1byte,非英文(可认为是中文)占2byte,根据这个特性来判断字符
public static boolean checkChar(char ch) {
if ((ch + "").getBytes().length == 1) {
return true;//英文
} else {
return false;//中文
}
}
public static String checkString(String str) {
String res = "";
if (str != null) {
for (int i = 0; i str.length(); i++) {
//只要字符串中有中文则为中文
if 纳毁(!checkChar(str.charAt(i))) {
res = "中文";
break;
岩山 } else {
res = "英文";
}
}
}
return res;
}
//判断是不是中文
public static boolean isChinese(char c) {
Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
|| ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
|| ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
return true;
}
return false;
}
//判断是不是英文字母
public static boolean isEnglish(String charaString) {
return charaString.matches("^[a-zA-Z]*");
}
//根据中文unicode范围判断u4e00 ~ u9fa5不全
public static String isChinese(String str) {
String regEx1 = "[\\u4e00-\\u9fa5]+";
String regEx2 = "[\\uFF00-\\uFFEF]+";
String regEx3 = "[\\u2E80-\\u2EFF]+";
String regEx4 = "[\\u3000-\\u303F]+";
String regEx5 = "[\\u31C0-\\u31EF]+";
Pattern p1 = Pattern.compile(regEx1);
Pattern p2 = Pattern.compile(regEx2);
Pattern p3 = Pattern.compile(regEx3);
Pattern p4 = Pattern.compile(regEx4);
Pattern p5 = Pattern.compile(regEx5);
Matcher m1 = p1.matcher(str);
Matcher m2 = p2.matcher(str);
Matcher m3 = p3.matcher(str);
Matcher m4 = p4.matcher(str);
Matcher m5 = p5.matcher(str);
if (m1.find() || m2.find() || m3.find() || m4.find() || m5.find())
return "中文";
else
洞枣备 return "英文";
}
public static void main(String[] args) {
System.out.println("使用长度判断:");
System.out.println(checkString("Hello++"));
System.out.println(checkString("Hello++。、,?"));
System.out.println(checkString("Hello++编程"));
System.out.println(checkString("编程"));
System.out.println("\r\n使用正则表达式判断:");
System.out.println(isChinese("Hello++"));
System.out.println(isChinese("Hello++。、,?"));
System.out.println(isChinese("Hello++编程"));
System.out.println(isChinese("编程"));
System.out.println("\r\n使用Character.UnicodeBlock");
System.out.println(isChinese('h')?"中文":"英文");
System.out.println(isChinese(',')?"中文":"英文");
System.out.println(isChinese('。')?"中文":"英文");
System.out.println(isChinese('编')?"中文":"英文");
}
}
JAVA中:中英文混合的字符串按字节截取问题
可以写个小的算法,每次取这个范围内的字符判断,然后清仿再取答举纤一半根据大小判断.
比如:10000个可以先用substring截7500个字符(最少5000,最多10000,取一半),然后根据字节数大小,再按一半答备的方式进行截(如果比10000字节少,就取5000-7500中间的 ,如果多,就取7500-10000),依次类推就可以了,直到取得结果.
这样应该是次数最少的了
java字符串中英文的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于java字符串中文乱码如何解决、java字符串中英文的信息别忘了在本站进行查找喔。
