iOS中 语音识别功能/语音转文字教程详解

简介:

每日更新关注:http://weibo.com/hanjunqiang  新浪微博

原文地址http://blog.csdn.net/qq_31810357/article/details/51111702

前言:最近研究了一下语音识别,从百度语音识别到讯飞语音识别;首先说一下个人针对两者的看法,讯飞毫无疑问比较专业,识别率也很高真对语音识别是比较精准的,但是很多开发者和我一样期望离线识别,而讯飞离线是收费的;请求次数来讲,两者都可以申请高配额,真对用户较多的几乎都一样。基于免费并且支持离线我选择了百度离线语音识别。比较简单,UI设计多一点,下面写一下教程:

1.首先:需要的库

2.我是自定义的UI所以以功能实现为主(头文件)

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. // 头文件  
  2. #import "BDVRCustomRecognitonViewController.h"  
  3. #import "BDVRClientUIManager.h"  
  4. #import "WBVoiceRecordHUD.h"  
  5. #import "BDVRViewController.h"  
  6. #import "MyViewController.h"  
  7. #import "BDVRSConfig.h"  

3.需要知道的功能:能用到的如下:

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. //-------------------类方法------------------------  
  2. // 创建语音识别客户对像,该对像是个单例  
  3. + (BDVoiceRecognitionClient *)sharedInstance;  
  4.   
  5. // 释放语音识别客户端对像  
  6. + (void)releaseInstance;  
  7.   
  8.   
  9. //-------------------识别方法-----------------------  
  10. // 判断是否可以录音  
  11. - (BOOL)isCanRecorder;  
  12.   
  13. // 开始语音识别,需要实现MVoiceRecognitionClientDelegate代理方法,并传入实现对像监听事件  
  14. // 返回值参考 TVoiceRecognitionStartWorkResult  
  15. - (int)startVoiceRecognition:(id<MVoiceRecognitionClientDelegate>)aDelegate;  
  16.   
  17. // 说完了,用户主动完成录音时调用  
  18. - (void)speakFinish;  
  19.   
  20. // 结束本次语音识别  
  21. - (void)stopVoiceRecognition;  
  22.   
  23. /** 
  24.  * @brief 获取当前识别的采样率 
  25.  * 
  26.  * @return 采样率(16000/8000) 
  27.  */  
  28. - (int)getCurrentSampleRate;  
  29.   
  30. /** 
  31.  * @brief 得到当前识别模式(deprecated) 
  32.  * 
  33.  * @return 当前识别模式 
  34.  */  
  35. - (int)getCurrentVoiceRecognitionMode __attribute__((deprecated));  
  36.   
  37. /** 
  38.  * @brief 设置当前识别模式(deprecated),请使用-(void)setProperty:(TBDVoiceRecognitionProperty)property; 
  39.  * 
  40.  * @param 识别模式 
  41.  * 
  42.  * @return 是否设置成功 
  43.  */  
  44. - (void)setCurrentVoiceRecognitionMode:(int)aMode __attribute__((deprecated));  
  45.   
  46. // 设置识别类型  
  47. - (void)setProperty:(TBDVoiceRecognitionProperty)property __attribute__((deprecated));  
  48.   
  49. // 获取当前识别类型  
  50. - (int)getRecognitionProperty __attribute__((deprecated));  
  51.   
  52. // 设置识别类型列表, 除EVoiceRecognitionPropertyInput和EVoiceRecognitionPropertySong外  
  53. // 可以识别类型复合  
  54. - (void)setPropertyList: (NSArray*)prop_list;  
  55.   
  56. // cityID仅对EVoiceRecognitionPropertyMap识别类型有效  
  57. - (void)setCityID: (NSInteger)cityID;  
  58.   
  59. // 获取当前识别类型列表  
  60. - (NSArray*)getRecognitionPropertyList;  
  61.   
  62. //-------------------提示音-----------------------  
  63. // 播放提示音,默认为播放,录音开始,录音结束提示音  
  64. // BDVoiceRecognitionClientResources/Tone  
  65. // record_start.caf   录音开始声音文件  
  66. // record_end.caf     录音结束声音文件  
  67. // 声音资源需要加到项目工程里,用户可替换资源文件,文件名不可以变,建音提示音不宜过长,0。5秒左右。  
  68. // aTone 取值参考 TVoiceRecognitionPlayTones,如没有找到文件,则返回NO  
  69. - (BOOL)setPlayTone:(int)aTone isPlay:(BOOL)aIsPlay;  

4.录音按钮相关动画(我自定义的,大家可以借鉴)

每日更新关注:http://weibo.com/hanjunqiang  新浪微博

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. // 录音按钮相关  
  2. @property (nonatomic, weak, readonlyUIButton *holdDownButton;// 说话按钮  
  3. /** 
  4.  *  是否取消錄音 
  5.  */  
  6. @property (nonatomic, assign, readwriteBOOL isCancelled;  
  7.   
  8. /** 
  9.  *  是否正在錄音 
  10.  */  
  11. @property (nonatomic, assign, readwriteBOOL isRecording;  
  12. /** 
  13.  *  当录音按钮被按下所触发的事件,这时候是开始录音 
  14.  */  
  15. - (void)holdDownButtonTouchDown;  
  16.   
  17. /** 
  18.  *  当手指在录音按钮范围之外离开屏幕所触发的事件,这时候是取消录音 
  19.  */  
  20. - (void)holdDownButtonTouchUpOutside;  
  21.   
  22. /** 
  23.  *  当手指在录音按钮范围之内离开屏幕所触发的事件,这时候是完成录音 
  24.  */  
  25. - (void)holdDownButtonTouchUpInside;  
  26.   
  27. /** 
  28.  *  当手指滑动到录音按钮的范围之外所触发的事件 
  29.  */  
  30. - (void)holdDownDragOutside;  

5.初始化系统UI

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. #pragma mark - layout subViews UI  
  2.   
  3. /** 
  4.  *  根据正常显示和高亮状态创建一个按钮对象 
  5.  * 
  6.  *  @param image   正常显示图 
  7.  *  @param hlImage 高亮显示图 
  8.  * 
  9.  *  @return 返回按钮对象 
  10.  */  
  11. - (UIButton *)createButtonWithImage:(UIImage *)image HLImage:(UIImage *)hlImage ;  
  12. - (void)holdDownDragInside;  
  13. - (void)createInitView; // 创建初始化界面,播放提示音时会用到  
  14. - (void)createRecordView;  // 创建录音界面  
  15. - (void)createRecognitionView; // 创建识别界面  
  16. - (void)createErrorViewWithErrorType:(int)aStatus; // 在识别view中显示详细错误信息  
  17. - (void)createRunLogWithStatus:(int)aStatus; // 在状态view中显示详细状态信息  
  18.   
  19. - (void)finishRecord:(id)sender; // 用户点击完成动作  
  20. - (void)cancel:(id)sender; // 用户点击取消动作  
  21.   
  22. - (void)startVoiceLevelMeterTimer;  
  23. - (void)freeVoiceLevelMeterTimerTimer;  

6.最重要的部分

每日更新关注:http://weibo.com/hanjunqiang  新浪微博

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. // 录音完成  
  2.  [[BDVoiceRecognitionClient sharedInstance] speakFinish];  

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. // 取消录音  
  2. [[BDVoiceRecognitionClient sharedInstance] stopVoiceRecognition];  

7.两个代理方法

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. - (void)VoiceRecognitionClientWorkStatus:(int)aStatus obj:(id)aObj  
  2. {  
  3.     switch (aStatus)  
  4.     {  
  5.         case EVoiceRecognitionClientWorkStatusFlushData// 连续上屏中间结果  
  6.         {  
  7.             NSString *text = [aObj objectAtIndex:0];  
  8.               
  9.             if ([text length] > 0)  
  10.             {  
  11. //                [clientSampleViewController logOutToContinusManualResut:text];  
  12.                   
  13.                 UILabel *clientWorkStatusFlushLabel = [[UILabel alloc]initWithFrame:CGRectMake(kScreenWidth/2 - 100,64,200,60)];  
  14.                 clientWorkStatusFlushLabel.text = text;  
  15.                 clientWorkStatusFlushLabel.textAlignment = NSTextAlignmentCenter;  
  16.                 clientWorkStatusFlushLabel.font = [UIFont systemFontOfSize:18.0f];  
  17.                 clientWorkStatusFlushLabel.numberOfLines = 0;  
  18.                 clientWorkStatusFlushLabel.backgroundColor = [UIColor whiteColor];  
  19.                 [self.view addSubview:clientWorkStatusFlushLabel];  
  20.                   
  21.             }  
  22.   
  23.             break;  
  24.         }  
  25.         case EVoiceRecognitionClientWorkStatusFinish// 识别正常完成并获得结果  
  26.         {  
  27.             [self createRunLogWithStatus:aStatus];  
  28.               
  29.             if ([[BDVoiceRecognitionClient sharedInstance] getRecognitionProperty] != EVoiceRecognitionPropertyInput)  
  30.             {  
  31.                 //  搜索模式下的结果为数组,示例为  
  32.                 // ["公园", "公元"]  
  33.                 NSMutableArray *audioResultData = (NSMutableArray *)aObj;  
  34.                 NSMutableString *tmpString = [[NSMutableString alloc] initWithString:@""];  
  35.                   
  36.                 for (int i=0; i < [audioResultData count]; i++)  
  37.                 {  
  38.                     [tmpString appendFormat:@"%@\r\n",[audioResultData objectAtIndex:i]];  
  39.                 }  
  40.                   
  41.                 clientSampleViewController.resultView.text = nil;  
  42.                 [clientSampleViewController logOutToManualResut:tmpString];  
  43.                   
  44.             }  
  45.             else  
  46.             {  
  47.                 NSString *tmpString = [[BDVRSConfig sharedInstance] composeInputModeResult:aObj];  
  48.                 [clientSampleViewController logOutToContinusManualResut:tmpString];  
  49.                   
  50.             }  
  51.              
  52.             if (self.view.superview)  
  53.             {  
  54.                 [self.view removeFromSuperview];  
  55.             }  
  56.               
  57.             break;  
  58.         }  
  59.         case EVoiceRecognitionClientWorkStatusReceiveData:  
  60.         {  
  61.             // 此状态只有在输入模式下使用  
  62.             // 输入模式下的结果为带置信度的结果,示例如下:  
  63.             //  [  
  64.             //      [  
  65.             //         {  
  66.             //             "百度" = "0.6055192947387695";  
  67.             //         },  
  68.             //         {  
  69.             //             "摆渡" = "0.3625582158565521";  
  70.             //         },  
  71.             //      ]  
  72.             //      [  
  73.             //         {  
  74.             //             "一下" = "0.7665404081344604";  
  75.             //         }  
  76.             //      ],  
  77.             //   ]  
  78. //暂时关掉 -- 否则影响跳转结果  
  79. //            NSString *tmpString = [[BDVRSConfig sharedInstance] composeInputModeResult:aObj];  
  80. //            [clientSampleViewController logOutToContinusManualResut:tmpString];  
  81.               
  82.             break;  
  83.         }  
  84.         case EVoiceRecognitionClientWorkStatusEnd// 用户说话完成,等待服务器返回识别结果  
  85.         {  
  86.             [self createRunLogWithStatus:aStatus];  
  87.             if ([BDVRSConfig sharedInstance].voiceLevelMeter)  
  88.             {  
  89.                 [self freeVoiceLevelMeterTimerTimer];  
  90.             }  
  91.               
  92.             [self createRecognitionView];  
  93.               
  94.             break;  
  95.         }  
  96.         case EVoiceRecognitionClientWorkStatusCancel:  
  97.         {              
  98.             if ([BDVRSConfig sharedInstance].voiceLevelMeter)   
  99.             {  
  100.                 [self freeVoiceLevelMeterTimerTimer];  
  101.             }  
  102.               
  103.             [self createRunLogWithStatus:aStatus];    
  104.               
  105.             if (self.view.superview)   
  106.             {  
  107.                 [self.view removeFromSuperview];  
  108.             }  
  109.             break;  
  110.         }  
  111.         case EVoiceRecognitionClientWorkStatusStartWorkIng// 识别库开始识别工作,用户可以说话  
  112.         {  
  113.             if ([BDVRSConfig sharedInstance].playStartMusicSwitch// 如果播放了提示音,此时再给用户提示可以说话  
  114.             {  
  115.                 [self createRecordView];  
  116.             }  
  117.               
  118.             if ([BDVRSConfig sharedInstance].voiceLevelMeter)  // 开启语音音量监听  
  119.             {  
  120.                 [self startVoiceLevelMeterTimer];  
  121.             }  
  122.               
  123.             [self createRunLogWithStatus:aStatus];   
  124.   
  125.             break;  
  126.         }  
  127.         case EVoiceRecognitionClientWorkStatusNone:  
  128.         case EVoiceRecognitionClientWorkPlayStartTone:  
  129.         case EVoiceRecognitionClientWorkPlayStartToneFinish:  
  130.         case EVoiceRecognitionClientWorkStatusStart:  
  131.         case EVoiceRecognitionClientWorkPlayEndToneFinish:  
  132.         case EVoiceRecognitionClientWorkPlayEndTone:  
  133.         {  
  134.             [self createRunLogWithStatus:aStatus];  
  135.             break;  
  136.         }  
  137.         case EVoiceRecognitionClientWorkStatusNewRecordData:  
  138.         {  
  139.             break;  
  140.         }  
  141.         default:  
  142.         {  
  143.             [self createRunLogWithStatus:aStatus];  
  144.             if ([BDVRSConfig sharedInstance].voiceLevelMeter)   
  145.             {  
  146.                 [self freeVoiceLevelMeterTimerTimer];  
  147.             }  
  148.             if (self.view.superview)   
  149.             {  
  150.                 [self.view removeFromSuperview];  
  151.             }  
  152.    
  153.             break;  
  154.         }  
  155.     }  
  156. }  

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. - (void)VoiceRecognitionClientNetWorkStatus:(int) aStatus  
  2. {  
  3.     switch (aStatus)   
  4.     {  
  5.         case EVoiceRecognitionClientNetWorkStatusStart:  
  6.         {     
  7.             [self createRunLogWithStatus:aStatus];  
  8.             [[UIApplication sharedApplication] setNetworkActivityIndicatorVisible:YES];  
  9.             break;     
  10.         }  
  11.         case EVoiceRecognitionClientNetWorkStatusEnd:  
  12.         {  
  13.             [self createRunLogWithStatus:aStatus];  
  14.             [[UIApplication sharedApplication] setNetworkActivityIndicatorVisible:NO];  
  15.             break;     
  16.         }            
  17.     }  
  18. }  

8.录音按钮的一些操作

每日更新关注:http://weibo.com/hanjunqiang  新浪微博

[objc]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. #pragma mark ------ 关于按钮操作的一些事情-------  
  2. - (void)holdDownButtonTouchDown {  
  3.     // 开始动画  
  4.     _disPlayLink = [CADisplayLink displayLinkWithTarget:self selector:@selector(delayAnimation)];  
  5.     _disPlayLink.frameInterval = 40;  
  6.     [_disPlayLink addToRunLoop:[NSRunLoop currentRunLoop] forMode:NSDefaultRunLoopMode];  
  7.       
  8.     self.isCancelled = NO;  
  9.     self.isRecording = NO;  
  10.       
  11.  // 开始语音识别功能,之前必须实现MVoiceRecognitionClientDelegate协议中的VoiceRecognitionClientWorkStatus:obj方法  
  12.     int startStatus = -1;  
  13.     startStatus = [[BDVoiceRecognitionClient sharedInstance] startVoiceRecognition:self];  
  14.     if (startStatus != EVoiceRecognitionStartWorking) // 创建失败则报告错误  
  15.     {  
  16.         NSString *statusString = [NSString stringWithFormat:@"%d",startStatus];  
  17.         [self performSelector:@selector(firstStartError:) withObject:statusString afterDelay:0.3];  // 延迟0.3秒,以便能在出错时正常删除view  
  18.         return;  
  19.     }  
  20.     // "按住说话-松开搜索"提示  
  21.     [voiceImageStr removeFromSuperview];  
  22.     voiceImageStr = [[UIImageView alloc]initWithFrame:CGRectMake(kScreenWidth/2 - 40, kScreenHeight - 1538033)];  
  23.     voiceImageStr.backgroundColor = [UIColor colorWithPatternImage:[UIImage imageNamed:@"searchVoice"]];  
  24.     [self.view addSubview:voiceImageStr];  
  25.      
  26. }  
  27.   
  28. - (void)holdDownButtonTouchUpOutside {  
  29.     // 结束动画  
  30.     [self.view.layer removeAllAnimations];  
  31.     [_disPlayLink invalidate];  
  32.     _disPlayLink = nil;  
  33.       
  34.     // 取消录音  
  35.     [[BDVoiceRecognitionClient sharedInstance] stopVoiceRecognition];  
  36.       
  37.     if (self.view.superview)  
  38.     {  
  39.         [self.view removeFromSuperview];  
  40.     }  
  41. }  
  42.   
  43. - (void)holdDownButtonTouchUpInside {  
  44.     // 结束动画  
  45.     [self.view.layer removeAllAnimations];  
  46.     [_disPlayLink invalidate];  
  47.     _disPlayLink = nil;  
  48.       
  49.     [[BDVoiceRecognitionClient sharedInstance] speakFinish];  
  50. }  
  51.   
  52. - (void)holdDownDragOutside {  
  53.       
  54.     //如果已經開始錄音了, 才需要做拖曳出去的動作, 否則只要切換 isCancelled, 不讓錄音開始.  
  55.     if (self.isRecording) {  
  56. //        if ([self.delegate respondsToSelector:@selector(didDragOutsideAction)]) {  
  57. //            [self.delegate didDragOutsideAction];  
  58. //        }  
  59.     } else {  
  60.         self.isCancelled = YES;  
  61.     }  
  62. }  
  63.   
  64.   
  65. #pragma mark - layout subViews UI  
  66.   
  67. - (UIButton *)createButtonWithImage:(UIImage *)image HLImage:(UIImage *)hlImage {  
  68.     UIButton *button = [[UIButton alloc] initWithFrame:CGRectMake(kScreenWidth/2 -36, kScreenHeight - 1207272)];  
  69.       
  70.     if (image)  
  71.         [button setBackgroundImage:image forState:UIControlStateNormal];  
  72.     if (hlImage)  
  73.         [button setBackgroundImage:hlImage forState:UIControlStateHighlighted];  
  74.       
  75.     return button;  
  76. }  
  77.   
  78. #pragma mark ----------- 动画部分 -----------  
  79. - (void)startAnimation  
  80. {  
  81.     CALayer *layer = [[CALayer alloc] init];  
  82.     layer.cornerRadius = [UIScreen mainScreen].bounds.size.width/2;  
  83.     layer.frame = CGRectMake(00, layer.cornerRadius * 2, layer.cornerRadius * 2);  
  84.     layer.position = CGPointMake([UIScreen mainScreen].bounds.size.width/2,[UIScreen mainScreen].bounds.size.height - 84);  
  85.     //    self.view.layer.position;  
  86.     UIColor *color = [UIColor colorWithRed:arc4random()%10*0.1 green:arc4random()%10*0.1 blue:arc4random()%10*0.1 alpha:1];  
  87.     layer.backgroundColor = color.CGColor;  
  88.     [self.view.layer addSublayer:layer];  
  89.       
  90.     CAMediaTimingFunction *defaultCurve = [CAMediaTimingFunction functionWithName:kCAMediaTimingFunctionDefault];  
  91.       
  92.     _animaTionGroup = [CAAnimationGroup animation];  
  93.     _animaTionGroup.delegate = self;  
  94.     _animaTionGroup.duration = 2;  
  95.     _animaTionGroup.removedOnCompletion = YES;  
  96.     _animaTionGroup.timingFunction = defaultCurve;  
  97.       
  98.     CABasicAnimation *scaleAnimation = [CABasicAnimation animationWithKeyPath:@"transform.scale.xy"];  
  99.     scaleAnimation.fromValue = @0.0;  
  100.     scaleAnimation.toValue = @1.0;  
  101.     scaleAnimation.duration = 2;  
  102.       
  103.     CAKeyframeAnimation *opencityAnimation = [CAKeyframeAnimation animationWithKeyPath:@"opacity"];  
  104.     opencityAnimation.duration = 2;  
  105.     opencityAnimation.values = @[@0.8,@0.4,@0];  
  106.     opencityAnimation.keyTimes = @[@0,@0.5,@1];  
  107.     opencityAnimation.removedOnCompletion = YES;  
  108.       
  109.     NSArray *animations = @[scaleAnimation,opencityAnimation];  
  110.     _animaTionGroup.animations = animations;  
  111.     [layer addAnimation:_animaTionGroup forKey:nil];  
  112.       
  113.     [self performSelector:@selector(removeLayer:) withObject:layer afterDelay:1.5];  
  114. }  
  115.   
  116. - (void)removeLayer:(CALayer *)layer  
  117. {  
  118.     [layer removeFromSuperlayer];  
  119. }  
  120.   
  121.   
  122. - (void)delayAnimation  
  123. {  
  124.     [self startAnimation];  
  125. }  

完成以上操作,就大功告成了!

温馨提示:

1.由于是语音识别,需要用到麦克风相关权限,模拟器会爆12个错误,使用真机可以解决;

2.涉及到授权文件相关并不复杂,工程Bundle Identifier只需要设置百度的离线授权一致即可,如下图:


最终效果如下:



有不懂或不明白的地方可以微博联系我:

每日更新关注:http://weibo.com/hanjunqiang  新浪微博


相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
1月前
|
存储 安全 数据安全/隐私保护
深入解析iOS 14隐私保护功能:用户数据安全的新里程碑
随着数字时代的到来,个人隐私保护成为全球关注的焦点。苹果公司在最新的iOS 14系统中引入了一系列创新的隐私保护功能,旨在为用户提供更透明的数据使用信息和更强的控制权。本文将深入探讨iOS 14中的几项关键隐私功能,包括App跟踪透明性、简化的隐私设置以及增强的系统安全性,分析它们如何共同作用以提升用户的隐私保护水平。
92 3
|
1月前
|
监控 搜索推荐 数据安全/隐私保护
深入探索iOS 14的隐私保护功能
本文将深入探讨iOS 14操作系统中的隐私保护功能,包括新的隐私指示器、应用程序跟踪透明度以及增强的隐私设置。我们将分析这些功能如何提高用户对个人数据的控制权,并讨论它们对应用开发者和广告行业的影响。
39 1
|
5月前
|
语音技术 开发工具 图形学
Unity与IOS⭐一、百度语音IOS版Demo调试方法
Unity与IOS⭐一、百度语音IOS版Demo调试方法
|
3月前
|
安全 Android开发 iOS开发
Android vs iOS:探索移动操作系统的设计与功能差异###
【10月更文挑战第20天】 本文深入分析了Android和iOS两个主流移动操作系统在设计哲学、用户体验、技术架构等方面的显著差异。通过对比,揭示了这两种系统各自的独特优势与局限性,并探讨了它们如何塑造了我们的数字生活方式。无论你是开发者还是普通用户,理解这些差异都有助于更好地选择和使用你的移动设备。 ###
61 3
|
5月前
|
测试技术 开发工具 虚拟化
iOS自动化测试方案(一):MacOS虚拟机保姆级安装Xcode教程
这篇文章提供了一份保姆级的教程,指导如何在MacOS虚拟机上安装Xcode,包括环境准备、基础软件安装以及USB扩展插件的使用,以实现iOS自动化测试方案的第一步。
252 0
iOS自动化测试方案(一):MacOS虚拟机保姆级安装Xcode教程
|
5月前
|
语音技术 开发工具 图形学
Unity与IOS⭐二、Unity接入IOS版百度语音:语音唤醒
Unity与IOS⭐二、Unity接入IOS版百度语音:语音唤醒
Unity与IOS⭐二、Unity接入IOS版百度语音:语音唤醒
|
6月前
|
人工智能 搜索推荐 iOS开发
苹果发布iOS 18 Beta 4,新增CarPlay 壁纸等多项功能改进
本文首发于公众号“AntDream”,探索iOS 18 Beta 4新功能与改进: CarPlay壁纸、iCloud设置访问优化、相机控制记忆、隐藏文件夹设计变更、深色/浅色模式图标同步、股票应用图标调整、iPhone镜像功能增强、控制中心蓝牙切换键、AssistiveTouch新增Type to Siri等,以及Apple Intelligence暗示。开发者可通过苹果计划提前体验。
116 12
|
5月前
|
人工智能 语音技术 Windows
语音识别教程:Whisper
本文是一份详细的Whisper语音识别模型使用教程,包括了FFmpeg的安装、Whisper模型的安装与使用,以及如何实现实时录制音频并转录的步骤和代码示例,旨在帮助用户基于Whisper和GPT创建AI字幕。
|
5月前
|
图形学 数据安全/隐私保护 iOS开发
Unity与IOS⭐Xcode打包,上架TestFlight的完整教程
Unity与IOS⭐Xcode打包,上架TestFlight的完整教程
|
6月前
|
达摩院 语音技术 异构计算
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg